「静止画や無音ビデオからオーディオを取得する」

「静止画や無音ビデオからオーディオを抽出する方法」

「サイドアイ」のアイデアは、FBIで働くフリンジ科学の調査官チームを取り扱ったSF番組「FRINGE」のエピソードに触発されました。彼らは溶けたガラス板から音声を抽出します。¶ クレジット:Matthew Modoono/ノースイースタン大学

ノースイースタン大学で開発された機械学習ツールは、静止画や消音されたビデオから音声を取得することができます。

「サイドアイ」と呼ばれるこのツールは、ほとんどのスマートフォンのカメラに標準搭載されている画像安定化技術を活用して、カメラの外で話している人の性別や正確な言葉を特定することが可能です。

ノースイースタン大学のケビン・フーは、カメラレンズを液体中で吊り下げている小さなバネが微視的な振動を経験し、カメラレンズの近くで誰かが話すと光がほとんど感知できないほど微妙に曲げられると説明しました。

スマートフォンのほとんどで使用されているローリングシャッター方式の撮影方法を利用して、研究者たちはこれらの振動から音波の周波数を抽出することができます。

「サイドアイ」は音声がわずかに消音されてしまいますが、機械学習と特定の単語や音声のトレーニングを活用することで、多くの情報を抽出することができるようになります。フー氏はノースイースタン・グローバル・ニュースの一部から述べています。全文を見る

要約版の著作権 © 2023 SmithBucklin、ワシントンD.C.、アメリカ

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

コンピュータサイエンス

「バンク・オブ・アイルランドのIT障害後、人々がATMに殺到する」

「アイルランド銀行は、一部の顧客が口座内の残高を超えて資金を引き出したり送金したりすることを可能にする技術的な問題を...

人工知能

「ジェネラティブAIブームは間もなく崩壊する」

持続不可能なハイプ、現在の技術の制約、現実離れした評価、未検証の事業モデルのため

AIニュース

「グローバルリーダーが警告、A.I.は「壊滅的な」被害を引き起こす可能性がある」と言っています

「英国のサミットでは、中国とアメリカを含む28の政府が、人工知能のリスク評価に関する協力に同意する宣言に署名しました」

データサイエンス

「Amazon SageMaker Data Wranglerを使用して、生成型AIのデータ準備をシンプルにする」

生成型人工知能(生成型AI)モデルは、高品質のテキスト、画像、およびその他のコンテンツを生成する能力を見せていますしか...