横浜の大学の研究者らが提案した「VirSen1.0:センサーに基づく人間のジェスチャー認識システムの開発を効率化するための仮想環境」

Researchers from a university in Yokohama proposed VirSen1.0 a virtual environment to streamline the development of sensor-based human gesture recognition systems.

ジェスチャー認識技術は、センサーの配置と配置、データの解釈、および機械学習の精度において重大な課題に直面しています。微妙な動きをキャプチャするためのセンサーの効率的な設定、結果のデータの信頼性のある解釈、および意図したジェスチャーを正確に認識するための機械学習アルゴリズムの確実な認識は、持続的な問題となっています。これらの問題は、最適なパフォーマンスを妨げるだけでなく、さまざまなアプリケーションでジェスチャーベースのシステムの広範な採用を制限しています。

横浜の大学の研究者チームは、コンピュータ化された人間のジェスチャー認識のための新しいモデルを発表しました。この研究では、仮想的な光学センサーを仮想空間に対話的に配置してジェスチャー推定システムを設計するためのユーザーインターフェース(UI)であるVirSen 1.0の開発について説明しています。これにより、物理的なセンサーの必要性を排除して、ユーザーはセンサーの配置を実験し、ジェスチャー認識に与える影響を評価することができます。

データは、アバターが所望のジェスチャーを行うことによってトレーニングのために収集されます。研究者たちは、センサー管理のシミュレータに関連する作業について議論し、シミュレータ、データ取得、およびモデル作成を組み合わせたアプローチのユニークさを強調しています。大量のトレーニングデータを収集することが実用的ではないため、サポートベクターマシン(SVM)分類器は、放射基底関数カーネルを使用しています。この研究では、順列特徴重要度(PFI)の貢献指標が高い認識率をもたらすセンサー配置の特定において重要性を強調しています。PFIは、個々の特徴がモデルの予測にどのように影響を与えるかを並べ替えることで測定します。PFIは特徴に関する洞察を提供し、試行錯誤のプロセス中にセンサーの配置を最適化するのに役立ちます。

この研究の光学センサーは、赤外線LEDとフォトディテクタトランジスタで構成されています。データの取得は、センサー値が前のフレームと比較して特定の閾値を超えたときに開始されます。人間のジェスチャーは、イナーシャルセンサをキャプチャするモーションキャプチャツールであるXsensを使用して記録されます。スイーティング、ジャンプ、リーニング、および手を上げるなど、6つの3Dジェスチャーが記録されています。実装には、シミュレータのインターフェースの視覚的な表現が含まれており、ユーザーはオブジェクトを配置し、データを収集し、センサーの値を視覚化し、PFIの貢献指標で精度を評価することができます。

研究チームは、シミュレータを改良する計画であり、過去の配置と結果を確認するための追加機能、PFIの貢献指標に基づいたセンサーの配置を提案する機能を含める予定です。将来の課題として、衣類が認識精度に与える影響を考慮していないこと、センサーノイズとエラーモデリングの欠如、処理速度、および認識対象の制限など、特定の制約を解消する予定です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

NumpyとPandasを超えて:知られざるPythonライブラリの潜在能力の解放

Pythonでのデータ操作と計算について話すとき、一般的にはPandasとNumpyを思い浮かべます他にも3つの強力なライブラリを見つ...

AI研究

チューリッヒ大学の研究者たちは、スイスの4つの公用語向けの多言語言語モデルであるSwissBERTを開発しました

有名なBERTモデルは、最近の自然言語処理の主要な言語モデルの1つです。この言語モデルは、入力シーケンスを出力シーケンスに...

機械学習

「Googleと一緒にジェネレーティブAIを学びましょう」

「Googleの10の無料コースでジェネラティブAIを学びましょう拡散モデル、エンコーダーデコーダーアーキテクチャ、アテンショ...

データサイエンス

「ゼロからLLMを構築する方法」

「これは、大規模言語モデル(LLM)を実践的に使用するシリーズの6番目の記事です以前の記事では、プロンプトエンジニアリン...

AI研究

天候の変化:AI、高速計算がより速く、効率的な予測を提供することを約束します

2050年までに、極端な天候や気候の頻度と厳しさが増すことにより、ミュンヘン再保険会社によれば、年間100万人の命が失われ、...