ウェイモのMotionLMを紹介します:最新型のマルチエージェントモーション予測アプローチで、大規模言語モデル(LLM)が自動車の運転をサポートできるようにする可能性のあるものです
ウェイモのMotionLM:次世代マルチエージェントモーション予測アプローチで、自動車運転のサポートが可能となる最新大規模言語モデル(LLM)の紹介
オートリグレッション言語モデルは、あらかじめ定義された文法や構文解析の概念を必要とせずに、文章内の次のサブワードを予測するのに優れています。この方法は、音声や画像の生成などの連続データドメインにも適用され、データが言語モデルの語彙と同様に離散的なトークンで表現されます。シーケンスモデルは、振る舞いなどの複雑で動的な文脈での使用に興味を引くため、その使いやすさから注目されています。
道路利用者は、行動と応答を交換するため、運転中に連続的な会話の参加者と比較されます。疑問は、同様のシーケンスモデルを使用して、言語モデルが複雑な言語分布を捉えるのと同様に、道路エージェントの振る舞いを予測するために使用できるかどうかです。エージェントの振る舞いの結合分布を独立したエージェントごとの周辺分布に分解することは、道路エージェントの振る舞いを予測するための人気のある戦略でした。この方向への進展があるにもかかわらず、これらの周辺予測には制約があります。なぜなら、複数のエージェントの将来の行動がお互いにどのように影響を受けるかを考慮に入れていないため、予測できない場面レベルの予測が生じる可能性があるからです。
これらの問題に対処するため、Waymoの研究者チームはMotionLMを導入しました。これは、自律走行車の安全な計画において重要な要素である道路エージェントの将来の振る舞いを予測するためのユニークなアプローチです。MotionLMの主なアイデアは、複数の道路エージェントの動きの予測の問題を言語モデリングの作業としてアプローチすることです。これは、道路エージェントの行動が言語であるかのように予測課題を構築し、フレーズを作成しているかのようにフレーム化します。
- CPR-CoachによるCPRトレーニングの革命:エラー認識と評価に人工知能を活用
- Amazon SageMakerのCanvas sentiment analysisとtext analysisモデルを使用して製品レビューから洞察を抽出するために、ノーコードの機械学習を使用してください
- 「Java での AI:Spring Boot と LangChain を使用して ChatGPT のクローンを構築する」
MotionLMは、他の既存の方法とは異なり、アンカーや複雑な潜在変数の最適化手法を使用しないでこれを実現しています。このモデルは、運動トークンのシーケンスを正確に予測する平均ログ確率を最大化する目標を持つ単純な言語モデリング手法を採用しています。モデルはシンプルであり、トレーニングも容易です。
多くの既存の手法では、個別のエージェントの軌跡を別々に生成し、その後エージェント間の相互作用を評価する二段階の手順を使用しています。一方、MotionLMは、複数のアクターの将来の行動について直接的に結合分布を構築するための単一のオートリグレッシブデコーディング手法を使用します。この相互作用モデリングの統合は、より効果的でシームレスです。MotionLMの時系列的な因果関係の分割作用により、時間的に因果関連性のある条件付きロールアウトも可能です。イベント間の因果関係を考慮して、将来のエージェントの振る舞いに関する予測が行われるため、その現実性と正確性が高まります。
評価では、MotionLMはWaymo Open Motion Datasetに対してテストされた際に大きな成果を上げました。インタラクティブなチャレンジにおいて他のアプローチよりも優れたパフォーマンスを示し、困難な状況下で道路エージェントの行動を予測するための他の手法よりも優れていることが示されました。結論として、MotionLMは自動車のマルチエージェントの動きの予測において画期的なアプローチであり、この分野で非常に有益な進歩です。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「ChatGPTがGPT-4V(Vision)とともに視覚を獲得することで、マルチモーダルAIが進化します」
- セールスフォース・アインシュタイン:あなたは顧客との関係を築きます、AIがそれらを自動的に維持する手助けをします
- 「改善された推論のためのアナロジー提示による言語モデルの拡張」
- 私たちは本当に人工知能AIウォーターマーキングを信頼できるのでしょうか? このAI論文は、現在のディープフェイクの防御方法の脆弱性を暴きます
- 大型言語モデルへの優しい導入
- Google DeepMindは、直接報酬微調整(DRaFT)を導入しました:微分可能な報酬関数を最大化するための効果的な人工知能手法における拡散モデルの微調整
- テキスト生成の評価におけるベクトル化されたBERTScoreのビジュアルガイド