ChatGPTがロボットの世界に足を踏み入れる:ボストン・ダイナミクスの最新メカニカルマーベルが今度は会話する

ChatGPTが美容とファッション界に彩りを添える:最新のメカニカルマーベル「ボストン・ダイナミクス」が会話能力を備える

画期的な開発が行われ、エンジニアリング会社であるボストン・ダイナミクスは、OpenAIが開発した洗練された言語モデルであるChatGPTを、その驚異的なロボットSpotの1つに統合しました。この犬のようなコンパニオンは、建物のガイド付きツアーを提供し、途中の展示物ごとに洞察に富んだ解説を行うことができるようになりました。

Spotは驚異的な変化を遂げ、特色ある個性の選択肢を持つようになりました。選択されたパーソナリティに応じて、ロボットの声、トーン、個人的な発言が適応します。

周囲の状況を認識するため、SpotはVisual Question Answering(VQA)モデルを利用し、画像のキャプションを生成し、それに関する簡潔な応答を提供することができます。この視覚データは約1秒ごとに更新され、テキストプロンプトとしてシステムに伝えられます。

Spotのコミュニケーション機能は、Respeaker V2スピーカー用の特別に作られた振動耐性マウントを追加することで強化されています。この革新的なハードウェアは、LEDが付いたリングアレイマイクロフォンで飾られたSpotのEAP 2ペイロードとUSBでシームレスに統合されます。

ロボットの制御は、デスクトップPCまたはノートパソコンのオフボードコンピュータによって管理され、そのコンピュータはSpotとの通信にはソフトウェア開発キット(SDK)を利用しています。EAP 2とのオーディオコミュニケーションを容易にするために、簡単なSpot SDKサービスが実装されています。

口頭応答に関しては、SpotはElevenLabsのテキスト読み上げサービスを利用しています。応答時間を最適化するため、エンジニアはテキストを「フレーズ」として並行してツールにストリーミングし、生成されたオーディオを直列で再生するシステムを考案しました。

個性を付加するため、Spotは今や身体の言語能力も持っています。移動するオブジェクトを識別し追跡することができ、最も近くの人物の位置を判断し、腕をその方向に向けることができます。愉快な演出の一環として、発話にはローパスフィルターが適用され、パペットの口の動きを模倣しています。この効果は、グリッパーにおかしな衣装を付けたり、くりくりした目をつけたりすることでさらに引き立てられます。

この実験の最も興味深い側面の1つは、AIの固有の論理ですが、最小限の微調整が必要でした。例えば、「親」という言葉について質問されたとき、Spotは驚くべきことに、それまでのモデルが存在する場所に自動的に移動し、おかしくもそれらを「先輩」と称しました。これは、モデルが意識を意味せずに概念間の統計的な関連性を確立する能力を示すものです。

ただし、デモンストレーションにはいくつかの制約があります。Spotも他の言語モデルと同様に、時折幻覚を経験することがあり、架空の情報を生成することがあります。この現象の興味深い例は、AIエージェントが集まるSimsにインスパイアされた町についての記事に見ることができます。さらに、応答にはわずかな遅延があり、ユーザーは約6秒待つことがあります。

これらのわずかな妨げにもかかわらず、このプロジェクトは、ロボティクスとAIの交差点での研究における重要な進歩を表しています。ボストン・ダイナミクスは、人間中心の環境でロボットのパフォーマンスを向上させることを目的として、この技術の融合をさらに探求することを約束しています。この有望な試みは、機械との相互作用の方法を革新し、知的なコンパニオンシップの新たな時代を築く可能性を秘めています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「E.U.法がディスインフォメーションに関する対立を引き起こす舞台を設定する」

「有害コンテンツを抑制するためにソーシャルメディア大手が新しいポリシーを採用するよう強制する法律によって、Xを所有する...

AIニュース

昆虫サイボーグ:精密な動きに向けて

研究者たちは、スティック昆虫の脚の筋肉における電気刺激が、ハイブリッド昆虫コンピュータロボットの精密なモーターコント...

AIニュース

「人型ロボットは人間よりも飛行機を操縦できる」

エンジニアや研究者は、コックピットの改造を必要とせずに飛行機を操縦できるヒューマノイドロボットを開発しています

機械学習

「品質と責任について大規模な言語モデルを評価する」

生成AIに関連するリスクは広く公表されています有毒性、偏見、逸出した個人情報、幻覚は組織の評判に悪影響を与え、顧客の信...

AIニュース

「AIはオーディオブック制作をどのように革新しているのか? ニューラルテキストtoスピーチ技術により、電子書籍から数千冊の高品質なオーディオブックを作成する」

現在では、多くの人々が書籍や他のメディアの代わりにオーディオブックを読んでいます。オーディオブックは、現在の読者が道...