研究者たちは、ビデオ記録を使用して、鳥の姿勢を3Dで追跡するための新しいマーカーレスAIメソッドを開発しました

Researchers developed a new markerless AI method to track bird posture in 3D using video recordings.

動物や鳥の行動、視線、微小な動きを追跡することは、研究者にとって困難な課題であり、正確な3Dアノテーションと複数の角度から撮影されたマーカーレスポーズトラッキングのための動物の注釈付き画像の大規模なデータセットの入手が依然として不足しています。鳥や動物の複雑な行動を観察し理解することの複雑さは、革新的なトラッキング方法の開発に世界的な取り組みをもたらしました。

この課題に取り組むため、コンスタンツ大学の集団行動の高度な研究のための卓越クラスター(CASCB)からの研究者たちは、行動研究を進めるためのデータセットを開発しました。このマーカーレスメソッドにより、個々の鳥の微小な行動を追跡し、その動きを観察することが可能になりました。

この研究チームは、映像記録を用いて鳥のポーズを識別し追跡するマーカーレスメソッドを成功裏に作成しました。彼らはこの方法を3D-POP(3Dポーズオブピジョン)と呼んでいます。この方法により、ピジョンの映像を記録し、各個体の視線と行動を簡単に識別することができます。したがって、動物にトランスミッターを取り付けて鳥を追跡および識別する必要はもはやありません。

また、このデータセットにより、2つのカメラのみを使用して鳥の行動パターンを集合的に研究することが可能になりました。研究者たちは、鳥にとって頭部と体の方向を追跡することで、給餌(地面つつく)、整理、警戒(頭部スキャン)、求愛(頭部下げる)、または歩行などの多くの重要な行動を定量化することができるという事実を利用しました。

この3D-POPメソッドを策定した研究者たちは、さまざまな視点から18羽のユニークなピジョンの映像記録を含め、グループのサイズが1、2、5、10のバリエーションを収集しました。彼らはまた、300Kフレームのデータセット全体での個々の識別、2D-3D軌跡、および2D-3Dポーズマッピングのための真の値を提供しました。彼らが作成したデータセットには、バウンディングボックス形式のオブジェクト検出のアノテーションも含まれています。

研究者たちは、ジュート生地(3.6m x 4.2m)上を移動するハトからデータセットを収集しました。そして、その生地上に穀物をばらまいて、ハトがその生地エリアで餌を食べるように促しました。その餌付けエリアは、モーションキャプチャ(mo-cap)システム(15m x 7m x 4m)が備えられた大型の囲いの中にありました。モーションキャプチャシステムには、モーションキャプチャカメラ(12台のVicon Vero 2.2、18台のVicon Vantage-5カメラ;100Hz)が30台装備されていました。餌付けエリアの角には、標準の三脚に取り付けられた4台の高解像度(4K)ソニーアクションカメラと、RGBと赤外線LEDライトを5秒ごとに点滅させるArduinoベースの同期ボックスが設置されていました。これらの18羽のハトは6日間の実験のために使用されました。実験のためには、毎日ランダムに10羽のハトが選ばれました。

この方法は、動物の行動、視線、微小な動きの追跡に役立っています。研究者たちは、このアノテーション方法が他の鳥や他の動物でも使用できると提案しており、研究者は他の動物の行動を研究し分析することもできるとしています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

Discover more

機械学習

「イギリスのテックフェスティバルが、クリエイティブ産業でAIを活用するスタートアップ企業を紹介する」

英国最大的技术节之一,企业和初创公司本周正展示他们最新的创新成果,举办研讨会,并庆祝位于英国西南部的技术生态系统的不...

人工知能

ChatGPT、GPT-4、Bard、およびClaudeを検出するためのトップ10ツール

AIモデルによって生成された論文、研究論文、課題、ドキュメンテーション、およびブログを検出するためのトップ無料ツール

機械学習

「カートゥーンアニメーションの未来を照らす:ラインドローイングインビトのイノベーション」

“`html 1900年代初頭にアニメーション制作が始まって以来、カートゥーンアニメーションは大きな進歩を遂げてきました。...

機械学習

Google AIはPixelLLMを提案します:細かい粒度のローカリゼーションとビジョン・ランゲージのアラインメントが可能なビジョン・ランゲージモデル

大規模言語モデル(LLMs)は、自然言語処理(NLP)、自然言語生成(NLG)、コンピュータビジョンなど、人工知能(AI)のサブ...

データサイエンス

「NASAのPower APIを使用して気候GPTを作成する」

この記事では、OpenAIの新しいGPT機能について探求しますこの機能は、外部のAPIを自動的に呼び出してデータを取得し、コード...