「インダストリー4.0 メタバースの解放:AR/VR、AI、および3Dテクノロジーが次世代産業革命を推進する方法」

Industry 4.0 Metaverse Liberation How AR/VR, AI, and 3D technology drive the next generation industrial revolution

没入型のミックスリアリティや拡張現実技術は、仮想現実(VR)と拡張現実(AR)で構成され、ビジネスの革新と拡大の主要な要因となっています。企業の運営方法や顧客とのやり取り、目標の達成方法を変革することにより、この技術的なソリューションセットは、さまざまな産業に大きな影響を与えています。

まだ幼い段階ではありますが、ARとVRの両方が20271年までに世界中で1億人以上のユーザーを超えると推定されています。このトレンドを実現するために、ユーザーに没入型の体験を提供するためにAR/VRアプリ開発サービスを採用する組織が、今日と将来において優れた成果を上げることが明確です。

AR/VRとは何ですか

デジタル世界とのユーザーの認識とインタラクションを向上させることを目指して、拡張現実(AR)と仮想現実(VR)は2つの別々だが関連する技術です。ARとVRの主な違いは使用されるデバイスと体験の性質です。ARは現実世界の環境で行われますが、VRは完全に仮想的なものです。

ARとVRは、XRまたは拡張現実として知られる没入型テクノロジーのカテゴリに含まれています。また、拡張現実と仮想現実を組み合わせたミックスドリアリティ(MR)もあります。それは物理的な世界とデジタル世界を組み合わせて、両者が並び立ち、リアルタイムでコミュニケーションを取る空間を構築します。

拡張現実またはARは、デジタルデータ(画像、ビデオ、3Dモデルなど)を物理環境に重ねることにより、ユーザーが周囲の環境を認識し、インタラクションする方法を向上させます。デジタルコンテンツは通常、スマートフォン、タブレット、または専用のAR眼鏡を使用してリアルタイムに表示されます。

AR技術の利用者は、周囲の環境を認識しながらも、仮想オブジェクトを表示してそれとインタラクションすることができます。製造、建設、小売り、医療など、さまざまなセクターでさまざまなARアプリケーションが見つかります。

仮想現実は、ユーザーを完全に仮想的な環境に没入させることができ、現実世界とは全く異なる場合もあります。VRヘッドセットを装着して入る仮想世界は、ユーザーの動きに反応し、対話型である場合もあります。

この技術は、ユーザーが実際に「内部」にいるような感覚を与えることにより、存在感と没入感をユーザーに提供することを目指しています。ARとVRには、興味深いビジネス機会を提供する独自の特性があります。

さらに興味深いことは、これらの没入型ミックスリアリティ技術が、3D人工知能(AI)、機械学習(ML)、クラウドサービス、モノのインターネット(IoT)と組み合わされ、トレーニング、デザイン、エンジニアリング、生産、ロボット工学、自動化など、さまざまな業界のビジネスに力を与えています。特に成長する電子商取引環境において、製造、医療、技術、建設、エネルギー、自動車、航空宇宙、金融サービスなどの企業は、競争力を持ち、将来の成長に適した位置にいます。

最終的に、これらの技術は、企業がより賢明な意思決定を行い、顧客により良いサービスを提供するために人的資本を補完するために活用されています。これにより、企業は顧客に対してより堅牢で個別化された体験を作り出すことができます。それが最終消費者であるか、サプライチェーン沿いのパートナーであるかに関わらず、スマートで成功を収めている組織は、拡張可能な運用のためにワークロード基盤をクラウド環境に移行し、新しいツールを立ち上げ、管理しています。

没入型ミックスリアリティが企業に挑戦し続ける場所

課題は、これらの技術が大量のデータを必要とし、非常に高速でデータを処理し、従来のオフィス環境では頻繁に許容されないコンピュータ環境でプロジェクトをスケーリングする能力が必要であるということです。

メタバースを通じて「Industry 4.0」を活用しようとする企業は、現実世界と仮想世界を正確かつ持続的に融合させる必要があります。これは、複雑なモデルやシーンを写実的な詳細でレンダリングし、正しい物理的位置(現実世界と仮想世界の両方に対して)で正確なスケールと姿勢で行うことを意味します。航空機のエンジンの部品や医療応用で使用される高度な手術デバイスの設計、製造、修理にAR/VRを活用するためには、正確さと精密性が求められます。

これは、現在、1つ以上のサーバからのディスクリートなGPUを使用してフレームをレンダリングし、Microsoft HoloLensやOculus Questなどのヘッドマウントディスプレイ(HMD)に無線またはリモートで配信することによって実現されています。

没入型ミックスリアリティにおける3DとAIの重要性

ミックスリアリティアプリケーションにおける主要な要件の1つは、オブジェクトにそのモデルやデジタルツインを正確に重ねることです。これにより、組み立てやトレーニングのための作業手順を提供し、製造上のエラーや欠陥を検出するのに役立ちます。ユーザーはまた、作業の進行に応じてオブジェクトを追跡し、レンダリングを調整することができます。

ほとんどのオンデバイスのオブジェクトトラッキングシステムは、2D画像および/またはマーカーベースのトラッキングを使用しています。これにより、2Dトラッキングは高い精度で深度を推定することができないため、3Dでのオーバーレイの精度が著しく制限されます。その結果、スケールやポーズも制限されます。つまり、ユーザーが一つの角度や位置から見たときに見た目が良さそうな一致を得ることができても、ユーザーが6DOFで移動するとオーバーレイの位置合わせが失われます。また、オブジェクトの検出、識別、およびそのスケールと方向推定(オブジェクト登録と呼ばれる)は、ほとんどの場合、計算的にまたは単純なコンピュータビジョン手法を使用して標準のトレーニングライブラリ(例:Google MediaPipe、VisionLib)を用いて達成されます。これは、手、顔、カップ、テーブル、椅子、ホイール、一般的なジオメトリ構造などの一般的かつ/または小さくて単純なオブジェクトにはうまく機能します。しかし、大規模で複雑なオブジェクトの場合、エンタープライズの使用例では、ラベル付きのトレーニングデータ(特に3Dの場合)はすぐに利用できません。これにより、2D画像ベースのトラッキングを使用してオブジェクトを位置合わせ、オーバーレイ、および持続的にトラッキングし、3Dでレンダリングされたモデルをそれと融合することが困難になります。

エンタープライズレベルのユーザーは、3D環境とAI技術を活用して、没入型ミックスリアリティのデザイン/ビルドプロジェクトにおけるこれらの課題を克服しています。

深層学習ベースの3D AIは、3D空間で任意の形状やサイズの3Dオブジェクトを高精度でさまざまな向きで識別できるようにします。このアプローチは任意の形状にスケーラブルであり、エンタープライズの使用例での複雑な3Dモデルとデジタルツインのレンダリングオーバーレイに使用することができます。

これはまた、完全な3Dモデルと部分的に完成した構造を登録するためにスケーリングすることもでき、建設や組み立ての進行中に使用することができます。ユーザーは、このプラットフォームアプローチにより、オブジェクトの登録とレンダリングにおいてミリメートル単位の精度を実現し、現在のデバイスのみのアプローチの制限を克服します。この3Dオブジェクトトラッキングのアプローチにより、エンタープライズアプリケーションで現実世界と仮想世界を真に融合させることができ、正確なコンテキストワークインストラクションでのトレーニング、建設および組み立てにおける欠陥およびエラーの検出、およびライフサイズの3Dレンダリングとオーバーレイによる3D設計およびエンジニアリングなど、多くの用途が開かれます。

クラウド環境での作業の重要性

エンタープライズやメーカーは、これらの技術を設計および展開する際に注意が必要です。なぜなら、それらが構築および最適化されるプラットフォームには大きな違いがあるからです。

AR/VRなどの技術は数年間使用されてきましたが、多くのメーカーは、すべての技術データがローカルに保存されるデバイス上で仮想ソリューションを展開しており、今日の仮想設計に必要なパフォーマンスとスケールが厳しく制限されています。これにより、新製品の設計や最適な仮想ビルドアウト方法の理解において、組織間の知識共有を行う能力が制限されます。

現在、メーカーは、分散クラウドアーキテクチャと3DビジョンベースのAIによって駆動されたクラウドベース(またはリモートサーバーベース)のAR/VRプラットフォームを活用することで、これらの制限を克服しています。これらのクラウドプラットフォームは、業界の革新を迅速かつスケーラブルに推進するために必要なパフォーマンスとスケーラビリティを提供します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「トップAIランダム顔生成アプリ(2023年)」

ランダムフェースジェネレーターは、最先端の画像処理技術を使用してランダムな顔を生成します。ビッグデータ技術によって、...

機械学習

Google AIはPixelLLMを提案します:細かい粒度のローカリゼーションとビジョン・ランゲージのアラインメントが可能なビジョン・ランゲージモデル

大規模言語モデル(LLMs)は、自然言語処理(NLP)、自然言語生成(NLG)、コンピュータビジョンなど、人工知能(AI)のサブ...

人工知能

「AV 2.0、自動運転車における次のビッグウェイブ」

自律型車載技術の新たな時代であるAV2.0は、知覚、計画、制御など多くの要素を制御できる統合型のAIモデルによって特徴付けら...

AI研究

このAI研究は、大規模言語モデル(LLM)における合成的な人格特性を説明しています

個人の人格は、質、特性、思考方法のユニークな組み合わせから成り立ちます。共有の生物学的および環境的な歴史により、最も...

機械学習

「NVIDIA BioNeMoがAWS上での薬剤探索のための生成型AIを可能にする」

主要な製薬会社やテクバイオ企業の研究者や開発者は、Amazon Web Servicesを通じてNVIDIA Claraソフトウェアとサービスを簡単...