カリフォルニア州ロングビーチで開催されたAWE June 2024イベントにおいて、分散型AI認識のパイオニアであるニルス・ピールは、AIによる小売業の変革に関する洞察に満ちた先進的なビジョンを発表した。彼の講演は、画期的なアイデアとすでに業界で波紋を呼んでいる実用的なソリューションで聴衆を魅了した。
ニルス・ピールのプレゼンテーションは、AI、ロボット工学、小売の未来に関心のある人にとって必見のものだ。分散型AI認識とその実用的な応用に関する彼の洞察は、まもなく私たちの日常生活のどこにでもあるようになるかもしれない変革的なテクノロジーを垣間見せてくれる。画期的な進歩と、それが小売業界をどのように再構築しうるのか、是非プレゼンテーションを全てご覧ください。
この講演をお見逃しなく。今すぐプレゼンテーションを見る
皆さん、こんにちは。ちょっと待ってください、こっそりと僕の2本目のプライベートマイクをつけさせてください。
さあ、いきましょう。そう、スライドも。もう大丈夫。皆さん、こんにちは。
話をしやすい聴衆に感謝しています。これは僕の社交不安症によく効くんだ。僕はニルス・ピールです。フィルみたいだけど、違う。スウェーデン出身です。
香港在住で、分散型AI認識の研究をしています。分散型機械認識ネットワークの構築をしているんです。今日は、なぜそれがすでに今日の小売業に役立つのか、またごく近い未来にできるようになることについてもお話ししようと思います。まず手始めに、未来についての話から始めます。皆さんは2030年の僕と一緒にいると思って、僕たちは人型ロボットと一緒にソファでくつろいでいます。
しかし、それは2030年の土曜日の朝で、僕たちは食料を切らしており、食料品店には行きたくない。そこでもちろん、ハンサムなコンパニオンを僕達の代わりに食料品店へ送り込み、たくさんの商品を買ってきてもらいたいと思う。必要なものの中にはケチャップもある。ではケチャップを買うために食料品店に入っていくロボットについて、話してみようと思います。このロボットがどう動くのか、少し見てみましょう。
あなたの人型ロボットが最初に直面する課題は、食料品店に行くことです。ロボットはあなたのアパートや家を出て、食料品店まで行かなければならない。一体どうやって行くんでしょう?GPSを使うかもしれませんね?グーグルマップのようなものを使うかもしれない。
ロングビーチのような大きな駐車場なら、それでうまくいくかもしれない。しかし、残念ながら都市は大きくなる。ニューヨークのような都市では、100メートル以上の高層ビルが900棟以上あります。それが何フィートなのかは知りませんが、非常に高い、900ものビルです。そしてGPSは見通し線(line of sight)ベースの技術です。
ニューヨークのような都市では、すでにGPSはロボットなどが食料品店にたどり着くのに役立つほど正確ではない。しかし、都市が大きくなればなるほど、それはさらに悪化する。私の住んでいる香港では、100メートル以上のビルは900棟ではありません。100メートル以上のビルは4,000棟以上あるので、GPSは問題外です。
しかし、残念なことに、状況はさらに悪くなる。都市はさらに巨大化していく。実際、飛行機かヘリコプター、ヘリコプターではないかもしれないが、飛行機に乗って香港を見ると、ちなみにこれが香港です、この小さな部分が香港。この残りはグレーターベイエリア。規模はロサンゼルス大都市圏より小さいが、8500万人が住んでおり、この中に北米とヨーロッパを合わせたよりも多くの高層ビルが建っています。
すると、ポジショニングは厄介なことになりそうです。ロボットとAIは近代的な都市を理解しなければならないのです。そしてその様子から判断して、近代的な都市の定義とは、都市が非常に大きいという理由だけでなく、ロボットの導入という理由からも、中国がある程度決定することになりそうです。2015年、それはもう驚くほど昔のことですが、2015年、中国のロボット部隊は米国のロボット部隊の規模を追い抜いた。
そして今日、実際には2年前、導入されたロボットのうち2台に一つが、中国に導入された。少し先行している韓国では、製造業で働く労働者の10分の1がすでにロボットとなっている。これはとんでもない事だ。つまり、ロボットの導入はアジアで非常に急速に進んでおり、これらの大都市では極めて急速に進んでいる。そしてGPSはそれにうまく対処できないだろう。しかし、食料品店まで行くと、事態はさらに複雑になります。食料品店には屋内GPSがないのですから。
グーグルマップは食料品店の中がどうなっているのか知らないし、GPSはそこで信号を受信できない。だからロボットは、他の人と同じように食料品を探して道に迷うことになる。そこでもちろん、大きな疑問が浮かぶ。
GPSの次に来るものは何か?私は、デバイスや機械、人工知能は、世界に対する独自の空間セマンティック理解を構築し始めなければならないと考えています。
空間セマンティックとは、物事の空間性を理解する一方で、物事のセマンティックなあり様も理解しなければならないということだ。これは動いている物事だということを理解する必要はあります。そして、私のSLAM(Simultaneous Localization and Mapping 「地図と位置の同時推定」の意。)アルゴリズムでは、その特徴点をあまり見てはいけない。これらは静止しているもので、信頼できるものです。これらは私を轢きそうなものだ。
空間の空間セマンティックな再構成が必要です。ロボットやAIは世界を物理的に認識する必要がある。実際に世界を認識する必要があるのだ。これはより厄介で、なぜなら、このハンサムなロボットも、その他市販されているロボットも、もちろんロボット自体に搭載されているセンサーに制限されているからだ。では、このハンサムなロボットが食料品店に来たら、彼は何をするのだろうか?
そう、彼は私たちと同じようにケチャップを探し回り、そこで大きな疑問が浮かぶ。このような大きく複雑な環境内でケチャップはどこにある?グーグルは知っているのだろうか?今回ばかりは、グーグルは知らない。そしてその理由は非常に興味深い。
その理由は、特にこのようなユースケースでは、中央集中型のポジショニングだ。グーグルやマイクロソフト、私たちのスポンサーであるナイアンティックが提供しているような集中的なビジュアルポジショニングは、実用的にも、また興味深いプライバシーの理由からも、実際の所よくありません。このような店舗を見てみると、ビジュアルマーチャンダイジング、つまり商品をどこに、いくつ、どの高さに配置するかは、小売業者にとって最も重要な秘密の一つだ。小売業者はこれに関してはとても不安を感じており、多くのアメリカの小売業者は、ビジュアルマーチャンダイジングに関連する情報をクラウドプロバイダーへ保存することを真っ向から拒否している。いかなるクラウドにも絶対に保存しない。これは超、超機密情報なのだ。
かれらはとても神経質で、私たちがゲリラマーケティングを行おうとしてよく経験するのは、カメラを付けているだけで食料品店から追い出されることだ。企業も人間なんだ。僕達と同じようにプライバシーが必要なのだ。彼らはGoogleに隠し場所を知られたくないし、僕達もGoogleに隠し場所を知られたくない。中央集中的なビジュアルポジショニングが問題だ。では、どうすればいいのでしょう?
僕らのロボットはどうやってケチャップを見つけ出すのだろう?もちろん、ロボットが店内を歩き回って探すなどということは受け入れられない。また、ロボットが次回のためにすべてを記録しているのであれば、店側がロボットを入店させるかどうかもわからない。つまり、店側はAIからの空間的な質問に答えられなければならないのだ。店側はロボットの質問に答えられる必要がある:ケチャップはどこですか?
店全体の地図を公開することなくだ。だから技術的には、コンピュータは世界を理解するために協力できなければならない。人型ロボットのコンピュータは、店舗のコンピュータと協力して、一緒に空間について推論できる共有座標システムを確立する必要がある。では、僕達が分散型のポジショニングシステムを構築したらどうだろう?セルフホスト型のポジショニングシステムを構築したらどうだろう?
データを自分でホスティングすることができる。アプリケーションに依存しないようにする。プラットフォームに依存しないようにする。そうすればうまくいくだろう?ここでどんでん返しがある。
僕達はもうそれを作っている。今日はそれを使ってできることをいくつかお見せしましょう。この美しいものは本物の食料品店です。残念ながら、どこの店かは言えません。しかし、この写真がクールなのは、これが複数の異なる...ただのiPhoneによって共同で再構築されたものだからです。普通のiPhoneが時間をかけて共同で再構築したのです。複数のiPhoneが、ただ構築している。それはすごくクールなことです。なぜなら、自己修復VPSのようなSF的なもののための基礎だけでなく、実際に空間AIが見ることができるデータを持っているのですから。店舗について知っていると何ができるのでしょうか?
それを知るために、私たちはこの共同的で外部的な空間感覚を構築しました。私たちはこれをドメインと呼んでいます。ドメインとは、環境について質問できるようにデバイスが接続する空間の外部感覚のことです。歩いていい場所はどこ?歩けない場所はどこ?どこに遮蔽物がある?遮蔽物がないのはどこ?など。
この2年間、このシステムを使って、いくつか私たちは本当にクールなことを成し遂げ、それは私たちの顧客も同様です。例えば、私たちは持続的で共有可能な拡張現実を実現させた。これはとてもクールで、これを使ってたくさんの素敵でギミックに富んだマーケティングを行うことができます。
しかし、その上に空間タスク管理システムを構築し、それをこれからお見せするのですが、これが大変なことになりました。私たちは商品検索を行い、買い物客であっても、勤務初日の従業員であっても、初回で店内のどんな商品でも見つけることができるようにした。ルート最適化も提供しました。つまり、もしあなたが勤務初日の従業員で、誰かのために商品を集めなければいけないショッピングカートがある場合、ルート最適化を使えば、それを行うことができるのです。そして、AIが生成するタスクも導入しました。今日は、空間タスク管理からスタートし、このような多くの事をお見せします。
音楽の音量をほんの少し下げられる?このツールを使えば、写真や説明文、問題の正確な位置情報を使って、お互いにタスクを作成することができます。だから、次のシフトに入ったときでも、後から来たときでも、スキャンするだけで問題のある場所に移動できる。これは店舗内の運営方法の変化を意味する。なぜならお互いを探す必要がなく、問題についてミーティングをする必要もないためだ。引き継ぎの手間が大幅に省ける。
実際、これを4ヶ月間毎日使い続けた結果、コープや先ほどの店舗では、引き継ぎ作業だけで従業員1人当たり1日15分以上の時間を節約できたと言っています。これは非常に大きなことです。それだけでなく、毎日より多くのタスクをこなすことができると話してくれています。なぜなら、このタスク管理のやり方はより楽しく、魅力的で、気落ちすることも少し減るからだ。エラー率の低下も感じているし、引継ぎでのミスも減っている。
タスクは1回目から正しく実行され、ストレスレベルも低くなっているという。シフトを開始するときに、あなたのやるべきこと、そして誰がどの順番で何に対処するかが20項目書かれた長い紙のリストをもらうよりも、この方が単純に対処しやすいのです。しかし、何よりもおそらく最も心躍る事は、それがエラー率が低くなった理由の1つでもあるのですが、認知障がいを持つ特別な支援を必要とするスタッフに本当に力を与えたと話してくれた事だ。このシステムを使い始めてからというもの、認知障がいを持つスタッフたちが、他のスタッフと同じレベルで業務をこなし、その環境の中で実に生き生きと働いている。
誤解や繰り返しはもうない。そして彼らは喜んでいる。私たちは、空間コンピューティングがどのように人々に力を与えることができるのかについて、とても強く期待しています。しかし、僕達はこれをAIが生成したタスクにも使用していることもお話ししました。今から非常に簡単なビデオをお見せしますが、これから見るものについての簡単な導入を話します。
店内のたくさんのウェブカメラのうち1つのウェブカメラをご覧いただきます。もちろん、1台のウェブカメラがRSTPでビデオをストリーミングし、空の棚を分析し探すAIサーバーへ送る。このサーバーは、空間タスク管理を行う別のサーバーと連携し、さらに物理的環境を理解するためにドメインサーバーである別のサーバーと繋がり、僕が手に持っているデバイスにもつながる。そうすると、僕にとっては非常に驚くべきことを、これから僕達は目にすることになる。見てください。
品切れは、小売業者にとって、買い物客のイライラと収益損失の主な原因です。買い物客は、探しているものが棚にない場合、代わりにオンラインで購入する可能性が高い。では、僕がその棚にあった最後のトイレットペーパーを買ったとしよう。店の奥にはまだ在庫があるかもしれないが、今のところ棚は空だ。トイレットペーパーが棚に戻るまでにどのくらいかかるのでしょうか?
幸運なことに、この店舗ではカクタス(旧コンバージェント)が稼働している。空間AIが店内の多くのカメラを通して見ており、すでに在庫切れを解決するためのタスクを作成し、ARナビゲーションも完了しているので、スタッフは人ができるよりも早く問題に対処することができる。空間AIを使えば、勤務初日のスタッフでもあらゆる問題や商品を瞬時に見つけることができる。小売業は、在庫切れによって年間1兆ドル近い収益を失っている。しかもそれは、スタッフのトレーニングコストを考慮する前段階の話だ。空間AIは、すべてのスタッフに、どこで何をすべきかを知る超人的な能力を与える。
つまり、これが共同的な空間コンピューティングのポイントなのです。私の携帯電話は、店内でやるべきことを認識していた。それは、あそこにあるAIサーバーと、あそこにあるたくさんのウェブカメラと、あそこにあるドメインサーバーが把握したものです。これらのすべてが一緒に空間について推論することができるので、他のコンピュータビジョンが教えてくれるようなこと、つまり、このカメラはスクリーンスペースのここに空の棚を検出した、というような情報を受け取らないのだ。
しかし、文字通り、物理的空間のどこに僕達が関心を持っている棚があるのか?もちろん、これはロボット工学のようなものにとって、非常に重要になります。私たちはAIが生成するタスクにとても期待をしています。とても期待しているので、Akuretという素晴らしい人たちと提携することにしました。今日Akuretも来てくれています。
AkuretはPOSデータと在庫レベル、データを見て、売上を増やす機会を検出する小売業者向けのAIを製造しています。これは基本的に、実店舗であなたが見に行く必要があるものをAIが推奨し、実際にその通りになっているかどうかを確認するものです。例えば、Akuretは在庫が思っているほど多くないことを予測することができる。そして、このような推奨に沿って行動した小売店では、売上が一貫して0.5%から1.5%増加することが分かっています。これはもちろん、とても大きな増加で、本当に、とてもエキサイティングな事だ。つまり、ここで得られるのは、私がロボット工学のハイブリッド時代の仮説と呼びたいものです。
これは人型ロボットがあちこちに登場するようになる前に、私たちが経験しなければならないことだ。ロボット工学のハイブリッド時代とは、人間の推論とAIの推論のどちらも欲しいというアイデアだ。人間の認識もAIの認識も欲しいが、人間の足や腕も使いたい。なぜならそれらは素晴らしいから。機械認識と人間の足があれば、AIが生成したタスクによって、多くの素晴らしいことができる。店内で何をすべきかがより早くわかるようになったり、空間コンピューティングツールによって、認知障がいのあるスタッフがより良い仕事をできるようになったり。空間コンピューティングとAIを融合させれば、スタッフとAIの両方の長所を引き出すことができる。
コンピュータビジョンが実際の空間に物を置くことができれば、コンピュータビジョンのコストパフォーマンスは良くなり、実際のスペースに物がある方が、スタッフを最大限に活かすことができる。
つまり、店舗は非常にダイナミックで挑戦が多いのです。店舗に拡張現実を導入する大きなチャンスがあることに気づいたのは、僕たちが初めてではありません。しかしビジュアルポジショニングは多くの理由から難題でした。ひとつは、すでに取り上げたように、そう、小売業者は自分たちの店舗のデジタルツインが他者のサーバー上に存在することを望まないからです。それだけでなく、店舗はものすごく変化するため、デジタルツインは常に更新されなければならない。
店舗のデジタルツインを今日作ったとしても、4日後には新しいものを作らなければならない。つまり、今日行われているようなビジュアルポジショニングは、あまりにももろいのです。繰り返しになりますが、私は、共同空間コンピューティングと、これらのシステムをセルフホスティングできること、そして訪問アプリケーションでさえも店舗の維持に貢献できる自己修復システムを持つことが、救いになると考えています。簡単に言えば、AIは世界を協調的に認識しなければならない。それがGPSの後に来るものだ。
GPSの後、願わくばインターネットの一部になるような普遍的な空間コンピューティングプロトコルが登場し、それによりさまざまなマシンやAIがつながり、座標システムを交換し、空間データを交換し、互いに空間コンピューティングリソースを借りあうことができるようになればと思います。それを可能にするのが、この非常にエキサイティングな新しいトレンドである分散型物理インフラネットワーク(DePIN)であると私は信じています。というのも、もし私たちがこれをセルフホスティングするのであれば、何らかの場所のポジショニングサービスに接続する未来のARメガネを想像してみると、メガネをかなり小型化できる。なぜなら空間コンピューティングの大部分をメガネから完全に取り出すことができ、これらのメガネのインフラは今や世界中に広がっているからです。DePINは、人々自らが資金を提供し、所有し、運営する社会規模のインフラを可能にするものだと信じています。これはとてもエキサイティングなことで、最もインパクトのあるDePINは、GPSに代わる分散型機械認識ネットワークになると思いますし、それがアジアの近代的な大都市の複雑な環境においても、協調的な空間コンピューティングを可能にすると思います。
これが僕達がポーズメッシュと呼ぶこのプロトコルを構築してきた理由です。あなたもこの上に構築できます。SDKも提供しています。私たちのアプリケーションを使う必要はなく、ポーズメッシュを使って好きなものを作ることができ、僕達はあなたの空間についてのいかなるデータも取得しません。僕たちはこれをAI認識のためのDePINとして構築しており、このローンチビデオをみなさんにご覧いただきたいです。
すべての空間には目的があり、意図を持って作られ、心を込めて維持されている。空間は私たちの最も良い所を引き出し、私たちに挑戦もする。Aukiは、あなたの空間のデジタルオーバーレイ、つまりあなた自身のドメインを作成することを可能にします。ドメインはあなたのキャンバスであり、仮想不動産であり、あなたの環境をデジタルなものやAIがアクセスしやすくします。人々がお互いを見つけ、時間を見つけ、場所を見つけるのを助ける。アプリケーションの数は増え続け、SDKはあなたの想像力を膨らませます。ドメインを取得することで、時代を先取りし、正しい道を歩むことができる。あなたは自分のドメインで何をしますか?
ありがとう。
もうすぐお近くの店舗にカクタスという空間AIがやってくる。ポーズメッシュ上で独自のアプリケーションを構築することに興味がある方は、ご連絡ください。私たちはAuki.aiです。空間AIの活用に興味のある小売業者の方は、カクタスへどうぞ。お時間をいただき、本当にありがとうございました。
私たちの使命は、XRコミュニティが拡張現実と仮想現実技術を発展させ、人類の進歩を支援することです。業界は2020年にマイルストーンである10億のARアクティブユーザーを達成しました。次の10年で、AWEは業界の関心を私たち自身の中核的な目標である、世界中の人々がXR業界で学び、繋がり、成長できるようにする事へ導くことを目指しています。
AWEコミュニティは、2030年までに1兆ドル規模のXR産業を構築するという目標を追求すると同時に、その成果が生きるに値する世界となるよう尽力している。
AWEは2010年にaugmenteality.orgによって初めて組織された。その主な使命は、デベロッパ、クリエイター、ファウンダー、製品リーダー、Cレベル幹部、愛好家、メディア、アナリストといった業界関係者を一堂に集め、拡張現実の普及を加速させることでした。
最初のAWEイベントは、わずか300名の参加者と数社の出展者から始まりました。今日、AWEイベントは、世界中からの数千人の参加者、数百のスポンサーと出展者、そして拡張現実、仮想現実、その他の没入型技術の専門家たちとの広範なネットワークを持つまでに成長しました。
2015年には初のAWE ASIAイベントが開催され、2016年には初のAWE Europeイベントがドイツで開催され、2018年にはAWE Tel Avivがそれに続きました。AWEはまたロングランの「AWE Nite」シリーズを導入し、その後、世界8カ国、19都市に支部が設立されました。
AWEが毎年開催しているAuggie Awardsは、2010年に始まって以来、世界で最も認知されたAR&VR業界の賞であり、今日も拡張現実、仮想現実、複合現実における最高のソリューションとイノベーションを紹介し続けています。
この10年間で、AWEは最も価値のあるAR/VRのグローバルコミュニティとなり、常にメンバーの学びとつながりを支援し、新たなビジネスチャンスを促進することに努めてきました。
Aukiはポーズメッシュという地球上、そしてその先の1000億の人々、デバイス、AIのための分散型機械認識ネットワークを構築しています。ポーズメッシュは、機械やAIが物理的世界を理解するために使用可能な、外部的かつ協調的な空間感覚です。
私たちの使命は、人々の相互認知能力、つまり私たちが互いに、そしてAIとともに考え、経験し、問題を解決する能力を向上させることです。人間の能力を拡大させる最も良い方法は、他者と協力することです。私たちは、意識を拡張するテクノロジーを構築し、コミュニケーションの摩擦を減らし、心の橋渡しをします。
X | LinkedIn | Medium | YouTube | AukiLabs.com
ポーズメッシュは、分散型で、ブロックチェーンベースの空間コンピューティングネットワークを動かすオープンソースのプロトコルです。
ポーズメッシュは、空間コンピューティングが協調的でプライバシーを保護する未来をもたらすよう設計されています。いかなる組織の監視能力も制限し、空間のプライベートな地図の自己所有権を奨励します。
分散化はまた、特に低レイテンシが重要な共同ARセッションにおいて、競争優位性を有します。ポスメッシュは分散化運動の次のステップであり、成長するテック大手のパワーに対抗するものです。
アウキ・ラボはポスメッシュにより、ポーズメッシュのソフトウェア・インフラの開発を託されました。
X | Discord | LinkedIn | Medium | Updates | YouTube | Telegram | Whitepaper | DePIN Network