ウェイモのMotionLMを紹介します:最新型のマルチエージェントモーション予測アプローチで、大規模言語モデル(LLM)が自動車の運転をサポートできるようにする可能性のあるものです

ウェイモのMotionLM:次世代マルチエージェントモーション予測アプローチで、自動車運転のサポートが可能となる最新大規模言語モデル(LLM)の紹介

オートリグレッション言語モデルは、あらかじめ定義された文法や構文解析の概念を必要とせずに、文章内の次のサブワードを予測するのに優れています。この方法は、音声や画像の生成などの連続データドメインにも適用され、データが言語モデルの語彙と同様に離散的なトークンで表現されます。シーケンスモデルは、振る舞いなどの複雑で動的な文脈での使用に興味を引くため、その使いやすさから注目されています。

道路利用者は、行動と応答を交換するため、運転中に連続的な会話の参加者と比較されます。疑問は、同様のシーケンスモデルを使用して、言語モデルが複雑な言語分布を捉えるのと同様に、道路エージェントの振る舞いを予測するために使用できるかどうかです。エージェントの振る舞いの結合分布を独立したエージェントごとの周辺分布に分解することは、道路エージェントの振る舞いを予測するための人気のある戦略でした。この方向への進展があるにもかかわらず、これらの周辺予測には制約があります。なぜなら、複数のエージェントの将来の行動がお互いにどのように影響を受けるかを考慮に入れていないため、予測できない場面レベルの予測が生じる可能性があるからです。

これらの問題に対処するため、Waymoの研究者チームはMotionLMを導入しました。これは、自律走行車の安全な計画において重要な要素である道路エージェントの将来の振る舞いを予測するためのユニークなアプローチです。MotionLMの主なアイデアは、複数の道路エージェントの動きの予測の問題を言語モデリングの作業としてアプローチすることです。これは、道路エージェントの行動が言語であるかのように予測課題を構築し、フレーズを作成しているかのようにフレーム化します。

MotionLMは、他の既存の方法とは異なり、アンカーや複雑な潜在変数の最適化手法を使用しないでこれを実現しています。このモデルは、運動トークンのシーケンスを正確に予測する平均ログ確率を最大化する目標を持つ単純な言語モデリング手法を採用しています。モデルはシンプルであり、トレーニングも容易です。

多くの既存の手法では、個別のエージェントの軌跡を別々に生成し、その後エージェント間の相互作用を評価する二段階の手順を使用しています。一方、MotionLMは、複数のアクターの将来の行動について直接的に結合分布を構築するための単一のオートリグレッシブデコーディング手法を使用します。この相互作用モデリングの統合は、より効果的でシームレスです。MotionLMの時系列的な因果関係の分割作用により、時間的に因果関連性のある条件付きロールアウトも可能です。イベント間の因果関係を考慮して、将来のエージェントの振る舞いに関する予測が行われるため、その現実性と正確性が高まります。

評価では、MotionLMはWaymo Open Motion Datasetに対してテストされた際に大きな成果を上げました。インタラクティブなチャレンジにおいて他のアプローチよりも優れたパフォーマンスを示し、困難な状況下で道路エージェントの行動を予測するための他の手法よりも優れていることが示されました。結論として、MotionLMは自動車のマルチエージェントの動きの予測において画期的なアプローチであり、この分野で非常に有益な進歩です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

インドのBharatGPTがGoogleの注意を引く

人工知能は、さまざまな産業やセクターを革命化することで、私たちの生活の一部になりました。バーチャルアシスタントから自...

人工知能

「アフリカのコミュニティが気候変動に適応するためにAIが助ける3つの方法」

先週、ケニアのナイロビで初めて開催されたアフリカ気候サミット(ACS)に参加し、アフリカの指導者と共に気候危機に対処する...

データサイエンス

「ベクターデータベースを使用してLLMアプリを作成する方法」

イントロダクション 人工知能の領域では、OpenAIのGPT-4、AnthropicのClaude 2、MetaのLlama、Falcon、GoogleのPalmなど、Lar...

AIニュース

FitBot — フィットネスチャットボットエージェント

健康意識が最前線にあり、バランスの取れたライフスタイルの追求が普遍的な願望となっている時代において、栄養は間違いなく...

データサイエンス

「StackOverflowが生成型AIに対応する方法」

OverflowAIは、強力な生成AIループによってプロセスを効率化することで、コンテンツ作成を革命化します

AIニュース

検索における生成AIが120以上の新しい国と地域に拡大します

「Generative AI in Search」または「Search Generative Experience(SGE)」は、世界中で拡大し、4つの新しい言語が追加され...