中国における大量生産自動運転の課題
Challenges of mass production autonomous driving in China.
XPeng Motors社の2023年の最近の進展
このブログ投稿は、バンクーバーで開催されたCVPR 2023のEnd-to-End自動運転ワークショップの基調講演に基づくもので、「中国における量産型自動運転の実践」と題されています。
自動運転は、特に中国での運転が世界でもっとも困難な場所の1つであるため、困難な課題です。動的な交通参加者、静的な道路構造、および交通信号が関与する3つの主要な要因があります。特に、信号の静的な幾何学がありながら、意味が動的であるため、交通信号の制御は独自の課題を提供します。以下では、動的なオブジェクトと静的な環境を簡単に見直し、交通信号という興味深く特別なトピックについて深く掘り下げます。
CVPR 2023自動運転ワークショップ | OpenDriveLab
当社パートナーであるVision-Centricとの協力により、今年4つの新しいチャレンジを発表することを誇りに思っています…
opendrivelab.com
動的および静的な課題
中国の自動車にとって、脆弱な道路利用者(VRU)などの動的な交通参加者は、重要な課題を提供します。VRUは予測不可能であり、さまざまなポーズを取り、ドライバーが最も予期しない場所に現れることがあります。大型動物が農村道路に突然現れることがあり、ペットが都市の通りに迷い込むことがあります。また、完全に荷物の詰まった車両や三輪車は、正確な車両タイプを特定することが困難です。中央列の最後の写真を考えてみると、最初にシーンを認識するのは人間でも非常に困難です。木の枝で満載された車両は、誤って完全にカモフラージュされています。
- 量子AI:量子コンピューティングの潜在能力を機械学習で解き明かす
- SRGANs:低解像度と高解像度画像のギャップを埋める
- このGoogleのAI論文は、さまざまなデバイスで大規模な拡散モデルを実行するために画期的なレイテンシー数値を集めるための一連の最適化を提示しています
静的な道路構造とトポロジーも、自動運転車にとって重大な課題を提供する可能性があります。たとえば、ここに示されている複雑な交差点は、扱う必要のある複雑さのレベルを示しています。SF映画からのスクリーンショットに似ていますが、実際にはGoogle Earthで見ることができる場所です。
拡大すると、中国特有かもしれない興味深い道路要素を見つけることができます。左折待ちエリアは、左折交通量のスループットを増やすように設計されており、一度の交通信号サイクル内でより多くの車両が交差点を通過できるようにします。設計には対称性がない場合があり、各方向は交通パターンに応じて個別に設計されます。そして、それに関する学術論文を見つけることができ、その有効性が証明されています。良い意図で提案されたものですが、新しいドライバーや自動運転車にとっては混乱を招く可能性があります。
待ちエリアとの交差点で左折するには、2つの手順が必要です。それぞれが異なる交通信号の組み合わせを必要とします。ここでは、最も一般的な交通信号パターンのみを示しました。交通信号の組み合わせはより複雑で、待ちエリアに専用の交通信号が含まれることがあります。
角落ちケースの王様:交通信号
これで、交通信号のすべての角落ちケースについて深く掘り下げることができます。交通信号は、おそらく最も長いテールの角落ちケースを持つオブジェクトのカテゴリーです。交通信号の知覚は、2つの異なる理由で複雑です。まず、交通信号の場所、タイプ、色を認識する必要があります。また、検出したすべての交通信号の中で、車両が注目すべき信号をどれにすべきかを知る必要があります。この決定を行うには、交通信号と異なる車線の正しいマッチングを取得することが重要です。
バス用の信号機は特別なタイプの信号機の1つです。2つの異なる理由で正しく認識する必要があります。まず、自律型車両の計画と制御のために、注意を払う必要がある信号機とは異なる情報を提供する可能性があるため、無視するために正しく認識する必要があります。また、近くのバスがどのように操舵するかを予測するために、その状態を正確に把握する必要があります。
中国のバス用信号機には、「BRT」「SRT」「バス」または単一の「B」といったラベルの付いたLEDライト、または「公交」(バス)や「有轨电车」(モノレール)などの特定の中国語の文字が表示されることがあり、可愛らしいバスを描いたアイコンが表示されることもあります。これらの特徴に加えて、交通標識の修飾子も含まれる場合があるため、自動運転車両がこれらの機能を検出して正確に対応するためには、それらを正確に検出して認識することが必要です。
バス専用信号機に加えて、もう1つの複雑なタイプの信号機がマルチバルブ信号機です。従来の信号機では1つの電球しか点灯しないのに対して、マルチバルブ信号機では同じソケット内で複数の電球が同時に点灯することがあります。したがって、信号機ボックスを検出するだけでは十分ではなく、個々の電球を検出してその意味を正確に解釈することも同様に重要です。
マルチバルブ信号機には、次の色の変更までのカウントダウンタイマーが表示されることがあります。北米では歩行者用のカウントダウンタイマーをよく見かけますが、これらのタイマーは車両用です。この情報が正しく使用されれば、スムーズな走行を改善するための計画に役立つ可能性があります。
カウントダウンタイマーは、さまざまな形式で表示されることがあります。単独のディスプレイであったり、信号機システムに統合されていたりすることがあります。数字の形式は、先頭のゼロの使用または不使用、使用されるフォントの違いなどがあります。さらに、プログレスバーのスタイルで設計された信号機もあります。これには、プログレスバーが徐々に短くなってから別の色の完全なプログレスバーに変わるアニメーションが含まれます。このデザインは最も革新的と考えられるかもしれませんが、知覚エンジニアにとっても課題を提供する可能性があります。
最後に、待ちエリア専用の信号機があります。アイコンやテキストの形を取ることができます。アイコンの場合、ライトが徐々に点灯して待ちエリアに案内するアニメーションが表示されることが一般的です。テキストの場合、LEDディスプレイや交通標識ボードに表示されることがあります。テキストの場合、標準的なパターンはありません。これには、光学文字認識(OCR)と自然言語処理の少しの取り扱いが必要で、意味を正確に抽出するために必要です。
XNGP:Xpengの自動運転ソリューション
著者による、量産されたXpeng車両が自動的に左折する様子の録画(動画)
著者による、量産されたXpeng車両が自動的に右折する様子の録画(動画)
これらの課題にもかかわらず、Xpengのチームは、2023年時点で中国で最高クラスの自動運転ソリューションを提供することに成功しました。Surround Reality(SR)ディスプレイには、オンボードパーセプションシステムから得られた情報のみが表示されます。左側では、ディスプレイは道路のジオメトリを正確に検出し、右側では、群れをなす歩行者が道路を横断している一般的なシナリオを描写しています。なお、表示される映像は、アフターマーケットの改造なしに、現在市場で入手可能な量産型Xpeng車両の実際の録画映像を表しています。
このことが可能になった背景については、BEV(鳥瞰図)パラダイムのエンドツーエンドパーセプションスタックであるXNetの展開に関する他の記事をご覧ください。これは、上記の量産型自動運転ソリューションの鍵であり、完全なエンドツーエンドの自動運転ソリューションに向けた堅固な基盤を築いています。
量産型自動運転におけるBEVパーセプション
XNet、XpengのBEVパーセプションアーキテクチャのレシピ
VoAGI.com
まとめ
- 中国での運転は、普遍的な動的オブジェクト、複雑な道路トポロジー、交通信号機のエクストリームなロングテールのコーナーケースなど、課題が多いです。
- 交通信号機には多くの特殊なタイプがあり、それぞれに多くのコーナーケースが存在します。場合によっては、複数の交通信号機を一緒に考える必要があり、近くのカウントダウンタイマーや交通標識とも考慮する必要があります。
- Xpeng Motorsは、これらの課題に立ち向かい、2023年時点で中国で最高クラスの量産型自動運転製品を提供しています。
参考文献
- Ma, Wanjing, et al. “Increasing the capacity of signalized intersections with left-turn waiting areas.” Transportation Research Part A: Policy and Practice 105 (2017): 181–196.
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- LLM-Blenderに会いましょう:複数のオープンソース大規模言語モデル(LLM)の多様な強みを活用して一貫して優れたパフォーマンスを達成するための新しいアンサンブルフレームワーク
- WAYVE社がGAIA-1を発表:ビデオ、テキスト、アクション入力を活用して現実的な運転ビデオを作成する自律性のための新しい生成AIモデル
- MIT教授が議会に語る「AIにおいて私たちは転換点にあります」
- 宇宙における私たちの位置を理解する
- 写真を撮るだけで、財産の査定を簡単にする
- 3つの質問:大規模言語モデルについて、Jacob Andreasに聞く
- 医療界はAIに備えているのか? 医師、コンピューターサイエンティスト、政策立案者たちは、慎重な楽観主義を示しています