横浜の大学の研究者らが提案した「VirSen1.0:センサーに基づく人間のジェスチャー認識システムの開発を効率化するための仮想環境」
Researchers from a university in Yokohama proposed VirSen1.0 a virtual environment to streamline the development of sensor-based human gesture recognition systems.
ジェスチャー認識技術は、センサーの配置と配置、データの解釈、および機械学習の精度において重大な課題に直面しています。微妙な動きをキャプチャするためのセンサーの効率的な設定、結果のデータの信頼性のある解釈、および意図したジェスチャーを正確に認識するための機械学習アルゴリズムの確実な認識は、持続的な問題となっています。これらの問題は、最適なパフォーマンスを妨げるだけでなく、さまざまなアプリケーションでジェスチャーベースのシステムの広範な採用を制限しています。
横浜の大学の研究者チームは、コンピュータ化された人間のジェスチャー認識のための新しいモデルを発表しました。この研究では、仮想的な光学センサーを仮想空間に対話的に配置してジェスチャー推定システムを設計するためのユーザーインターフェース(UI)であるVirSen 1.0の開発について説明しています。これにより、物理的なセンサーの必要性を排除して、ユーザーはセンサーの配置を実験し、ジェスチャー認識に与える影響を評価することができます。
データは、アバターが所望のジェスチャーを行うことによってトレーニングのために収集されます。研究者たちは、センサー管理のシミュレータに関連する作業について議論し、シミュレータ、データ取得、およびモデル作成を組み合わせたアプローチのユニークさを強調しています。大量のトレーニングデータを収集することが実用的ではないため、サポートベクターマシン(SVM)分類器は、放射基底関数カーネルを使用しています。この研究では、順列特徴重要度(PFI)の貢献指標が高い認識率をもたらすセンサー配置の特定において重要性を強調しています。PFIは、個々の特徴がモデルの予測にどのように影響を与えるかを並べ替えることで測定します。PFIは特徴に関する洞察を提供し、試行錯誤のプロセス中にセンサーの配置を最適化するのに役立ちます。
- このAI研究論文は、視覚の位置推定とマッピングのための深層学習に関する包括的な調査を提供しています
- マイクロソフトの研究者は、2段階の介入フレームワークを使用したオープンボキャブラリー責任ある視覚合成(ORES)を提案しています
- 「スピーチの回復を革新する:スタンフォード主導の研究が制約のないコミュニケーションのための高性能な神経プロステーシスを公開」
この研究の光学センサーは、赤外線LEDとフォトディテクタトランジスタで構成されています。データの取得は、センサー値が前のフレームと比較して特定の閾値を超えたときに開始されます。人間のジェスチャーは、イナーシャルセンサをキャプチャするモーションキャプチャツールであるXsensを使用して記録されます。スイーティング、ジャンプ、リーニング、および手を上げるなど、6つの3Dジェスチャーが記録されています。実装には、シミュレータのインターフェースの視覚的な表現が含まれており、ユーザーはオブジェクトを配置し、データを収集し、センサーの値を視覚化し、PFIの貢献指標で精度を評価することができます。
研究チームは、シミュレータを改良する計画であり、過去の配置と結果を確認するための追加機能、PFIの貢献指標に基づいたセンサーの配置を提案する機能を含める予定です。将来の課題として、衣類が認識精度に与える影響を考慮していないこと、センサーノイズとエラーモデリングの欠如、処理速度、および認識対象の制限など、特定の制約を解消する予定です。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- チューリッヒ大学の研究者たちは、スイフトという自律型ビジョンベースのドローンを開発しましたこのドローンは、いくつかの公平なヘッドトゥヘッドレースで人間の世界チャンピオンに勝つことができます
- 「NTUシンガポールの研究者たちは、テキストから3D生成のための新しいプラグアンドプレイなリファインメントAIメソッドであるIT3Dを提案しています」
- バージニア工科大学とマイクロソフトの研究者がアイデアの探求と推論の能力を高めるAIアプローチ、アルゴリズムオブソウツを紹介
- 「The Research Agent 大規模なテキストコーパスに基づいた質問に答える課題への取り組み」
- 「ニューヨーク大学の研究者が、人の見かけの年齢を画像内で変える新しい人工知能技術を開発しましたが、その人の独自の識別特徴を維持します」
- Googleの研究者たちは、AIによって生成された画像を透かしを入れたり識別するためのデジタルツールである「𝗦𝘆𝗻𝘁𝗵𝗜𝗗」を紹介しました
- 「GoogleはDeepfakeへの対策として、AIによって生成された画像にウォーターマークを付けます」