オックスフォード大学の研究者たちは、DynPointという人工知能アルゴリズムを開発しましたこのアルゴリズムは、自由な単眼ビデオの新しい視点を迅速に合成することを目的としています

「オックスフォード大学の研究者が開発した人工知能アルゴリズムDynPoint:自由な単眼ビデオにおける新たな視点合成のための革新」

コンピュータビジョンコミュニティは、画像合成(VS)に注力しており、それによって人工現実性を推進し、機械の視覚および幾何学的な特定シナリオの理解能力を向上させる潜在能力を持っています。ニューラルレンダリングアルゴリズムを利用した先進的な手法により、静的シーンの写真のような再構築が実現されています。ただし、動的な要素を持つ実世界のシナリオでは、エピポーラ幾何学的な関係に依存する現在の手法は適しておらず、これらの方法には課題が存在します。

最近の研究は、1つ以上のマルチレイヤーパーセプトロン(MLP)を使用して動的な環境でのビュー合成に主に焦点を当てています。ある手法では、ターゲットビデオのフレームレベルまで包括的な潜在表現を生成します。ただし、MLPや他の表現手法のメモリ容量の制約により、この手法の適用範囲は短いビデオに制限されますが、視覚的に正確な結果を提供する能力はあります。

この制約に対処するために、オックスフォード大学の研究者はDynPointを提案しました。このユニークな手法では、長い単眼ビデオからビューを効率的に生成するために、潜在的なカノニカル表現を学習する必要はありません。DynPointは、表面点の一貫性のある深度とシーンフローを明示的に推定する方法を採用し、情報を暗黙的にエンコードする従来の手法とは異なります。これらの推定値を使用して、複数の参照フレームの情報をターゲットフレームに組み合わせます。その後、この収集したデータから階層的なニューラルポイントクラウドが構築され、この階層的なポイントクラウドを使用してターゲットフレームのビューが合成されます。

この統合プロセスは、ターゲットフレームと参照フレーム間の対応を学習し、深さとシーンフローの推論によって支援されます。単眼ビデオ内でターゲットフレームの迅速な合成を可能にするために、研究者は参照フレームからターゲットフレームに情報を集約するための表現を提供しています。Nerfie、Nvidia、HyperNeRF、iPhone、Davisなどのデータセット上でDynPointの合成速度と精度の評価が行われており、実験結果によってその優れた性能が証明されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

メタAI研究者が生産準備完了の強化学習AIエージェントライブラリ「Pearl」をオープンソース化

強化学習(RL)は、エージェントが適切なアクションを取り、報酬を最大化するために学習する機械学習のサブフィールドです。...

データサイエンス

「力強いコネクティビティ:IoTにおけるエッジコンピューティングの復興」

エッジコンピューティングとIoTがリアルタイムの効率化、帯域幅の最適化、およびイノベーションのために結集します課題はまだ...

AIニュース

「Hill Climbing Algorithm in AIとは何ですか?」

はじめに 人工知能(AI)の複雑な世界では、ヒルクライミングアルゴリズムが問題解決のための基本的な手法として登場します。...

人工知能

「AI倫理ツールキットが機能する理由を探る」

AIシステムの重要な影響を持つアプリケーションでの使用が増えるにつれて、専門家たちはこれらのシステムを設計する際により...

機械学習

Google DeepMind(グーグルディープマインド)が「GNoME(グノーム)」を発表:新素材の安定性を予測し、探索の速度と効率を劇的に向上させる新しいディープラーニングツール

無機結晶は、コンピュータチップ、バッテリー、太陽電池など、現代の多くの技術にとって不可欠です。安定した結晶は、細心の...

機械学習

Google AIは、スケールで事前に訓練されたニューラルネットワークを剪定するための最適化ベースのアプローチ、CHITAを紹介します

今日のニューラルネットワークの成果は、言語、数学、ビジョンなど、さまざまな分野で驚くべきものです。ただし、これらのネ...