NVIDIAリサーチがCVPRで自律走行チャレンジとイノベーション賞を受賞

'NVIDIA Research wins Autonomous Driving Challenge and Innovation Award at CVPR.'

NVIDIAは、カナダのバンクーバーで開催されるComputer Vision and Pattern Recognition Conference(CVPR)において、自律走行開発の3D占有予測チャレンジで激戦を制し、優勝者として紹介されます。

この競技には、10地域にまたがる約150チームから400以上の投稿がありました。

3D占有予測とは、シーン内の各ボクセルの状態を予測するプロセスであり、つまり3Dバードアイビューグリッド上の各データポイントを指します。ボクセルは、フリー、占有、または不明として識別することができます。

安全で堅牢な自動運転システムの開発に不可欠な3D占有グリッド予測は、NVIDIA DRIVEプラットフォームによって可能になる最新の畳み込みニューラルネットワークやトランスフォーマーモデルを使用して、自律車両(AV)の計画および制御スタックに情報を提供します。

「NVIDIAの優勝ソリューションには、2つの重要なAVの進歩があります」と、NVIDIAの学習と知覚のシニアリサーチサイエンティストであるZhiding Yu氏は述べています。「優れたバードアイビュー認識を生み出す最新のモデル設計を実証することができます。さらに、3D占有予測での10億パラメーターまでのビジュアルファウンデーションモデルの効果と大規模な事前学習の有効性を示しています。」

自動運転の知覚は、画像内のオブジェクトや空きスペースなどの2Dタスクの処理から、複数の入力画像を使用して3Dで世界を理解することに進化しています。

これにより、複雑な交通シーン内のオブジェクトについて柔軟で精密な細かい表現が提供されるようになり、これはNVIDIAのAV応用研究および著名な科学者であるJose Alvarez氏によれば、「自律走行の安全感知要件を達成するために重要です。」

Yu氏は、NVIDIA Researchチームの受賞作品を、6月18日(日)10:20 a.m. PTに開催されるCVPRのEnd-to-End Autonomous Driving Workshopおよび6月19日(月)4:00 p.m. PTに開催されるVision-Centric Autonomous Driving Workshopで発表します。

チャレンジで優勝しただけでなく、NVIDIAはイノベーション賞も受賞し、CVPRワークショップ委員会によれば、「従来のアプローチと比較して、ビュー変換モジュールの開発における新しい洞察を認識し、実際に改善されたパフォーマンスを示しています。」

提出物についてのNVIDIAの技術レポートを読む。

3D占有予測による安全な車両

3D物体検出(物体を検出および表現すること、しばしば3D境界ボックスを使用する)は、AV知覚における中核的なタスクですが、限界があります。たとえば、表現力に欠けるため、境界ボックスは十分な現実世界の情報を表していない可能性があります。また、稀にしか現実世界で見られない道路の危険など、すべての可能なオブジェクトについての分類と基準を定義する必要があります。

それに対して、3D占有予測は、自律走行車両の計画スタックに世界に関する豊富な情報を提供するため、エンドツーエンドの自律走行に必要です。

ソフトウェア定義の車両は、時間をかけて検証された証明済みの新しい開発を継続的に受け取ることができます。CVPRで認められた研究イニシアチブから進化した最新のソフトウェアアップデートにより、新しい機能とより安全な運転能力が提供されるようになっています。

NVIDIA DRIVEプラットフォームは、自動車からデータセンターに至るまで、安全でセキュアなAV開発のためのフルスタックハードウェアおよびソフトウェアを提供する、自動車メーカーにとっての生産への道を提供します。

CVPRチャレンジについて

CVPRの3D占有予測チャレンジでは、推論中にカメラ入力のみを使用するアルゴリズムを開発することが求められました。参加者は、オープンソースのデータセットやモデルを使用することができ、データ駆動型のアルゴリズムや大規模なモデルの探索を容易にすることができます。主催者は、最新の3D占有予測アルゴリズムのベースラインサンドボックスを提供し、実世界のシナリオでのアルゴリズムの性能を評価しました。

NVIDIAのCVPRにおける活躍

NVIDIAは、CVPRで約30の論文やプレゼンテーションを発表しています。自律走行について議論する専門家には、以下が含まれます。

  • 自律走行ワークショップ:Emerging Tasks and Challenges Workshopにおいて、Jose Alvarez氏は、AVの3D知覚に対する新興の課題について説明し、Embedded Vision Workshopにおいて大規模なディープモデルのリアルタイム推論の最適化について説明します。
  • NVIDIAの深層学習ディレクターであるNikolai Smolyanskiy氏は、自律走行ワークショップ:Perception、Prediction、Planning and Simulationにおいて、AVのリアルタイムトラフィック予測について説明します。
  • NVIDIAの著名なエンジニアであるRobin Jenkin氏は、CVPRと併せて開催されるOmniCV Workshopにおいて、魚眼カメラの画像品質について説明します。
  • NVIDIAのAV研究科学者であるXinshuo Weng氏は、Vision-Centric Autonomous Driving Workshopにおいて、自律走行におけるビジョンソリューションについて説明します。

アジェンダの他のトークを見て、6月18日から22日まで開催されるCVPRでNVIDIAについてもっと学びましょう。

注目の画像は、OccNetとOcc3Dによる提供です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

    Discover more

    機械学習

    「ディープラーニングを用いたナノアレイの開発:特定の構造色を生み出すことができるナノホールアレイを設計する新しいAI手法」

    色の多様性は、2つ以上の色の組み合わせによってさらに増加します。光は微細なナノ構造と相互作用し、複数の色の固有のパター...

    機械学習

    デシAIは、DeciDiffusion 1.0を公開しました:820億パラメータのテキストから画像への潜在的拡散モデルで、安定した拡散と比べて3倍の速度です

    問題の定義 テキストから画像を生成することは、人工知能において長い間の課題でした。テキストの説明を鮮明でリアルな画像に...

    AIニュース

    「AIが、人間が想像もできない高効果な抗体を作り出している」

    「ロボット、コンピュータ、アルゴリズムは、人間ができない方法で潜在的な新しい治療法を探し求めています」

    機械学習

    Google DeepMindは、直接報酬微調整(DRaFT)を導入しました:微分可能な報酬関数を最大化するための効果的な人工知能手法における拡散モデルの微調整

    拡散モデルは、さまざまなデータタイプでの生成モデリングを革新しました。ただし、テキストの説明から見た目の良い画像を生...

    人工知能

    「GPT-4に対する無料の代替案トップ5」

    GPT-4がすごいと思っている?これらの生成AIの新参者たちは既に注目を集めているよ!

    データサイエンス

    データ再構築の革命:広範な情報検索におけるAIのコンパクトな解決策

    最近の進展により、ロスアラモス国立研究所の研究チームが、画期的な人工知能(AI)手法を開拓し、データ処理における前例の...