UCSFとUC Berkeleyの研究者たちは、脳幹の脳卒中による重度の麻痺を持つ女性がデジタルアバターを通じて話すことができるようにする脳-コンピューターインタフェース(BCI)を開発しました

UCSF and UC Berkeley researchers have developed a brain-computer interface (BCI) that enables women with severe paralysis from brainstem stroke to communicate through a digital avatar.

人工知能は今日では音声と顔の認識に重要な役割を果たしています。これらの信号は脳の信号によって記録・合成され、AIの劇的な利用を可能にしています。この技術は、これらの信号をテキストにエンコード・デコードすることも、驚くほどの速度で行うことができます。これにより、システムはさらに強力になります。これらの音声と顔の認識の技術は、自然言語処理という広範なカテゴリに属しています。研究者たちはまだ、麻痺した人々のために音声と顔の認識を可能にするAIを探し続けています。

UCサンフランシスコ大学とUCバークレー大学の研究者たちは、脳-コンピュータインターフェースを開発しました。これは、脳の電気的なインパルスと外部デバイス(おそらくはロボットまたはAIチャットボット)との直接的な通信経路とも呼ばれます。麻痺した女性でさえデジタルアバターと会話できるという結果が示されています。これらの研究者は、他の人との最も自然なコミュニケーション方法である強力なコミュニケーション体を埋め込むことを目指しています。AIは、麻痺や話すことができない患者に対する解決策を提供しました。研究者たちは、音声認識に重要な役割を果たす、女性の体表面に長方形の電極を実装しました。これらの電極は、彼女の体を伝わる脳信号またはインパルスを実装し、彼女の認識を容易に利用できるようにしました。研究者たちは、モデルを訓練し、システムが使用する人工知能アルゴリズムを改善することで、システムの正確性を向上させました。これには、異なるフレーズを何度も繰り返し使用し、システム内のNLPのワードバッグモデルを使用しました。研究者たちはまた、AIモデルをトレーニングして、これらの単語を音素に認識・エンコードすることもできるようにしました。これにより、システムの正確性が向上し、以前よりも速くなりました。

研究者たちは、彼女の結婚式の録音声を使用して彼女の声を生成するためのアルゴリズムを開発しました。生成された音声にはいくつかの欠陥がありましたが、後に研究者たちは以前に生成された声の品質を改善するために取り組みました。これらの研究者はまた、女性の顔認識に役立つデジタルアバターも開発しました。研究者たちはまた、女性の脳信号とアバターを統合する機械学習モデルも作成しました。これにより、彼女の顎、唇、舌、口などのすべての動きが記録されました。

研究者たちは、人体とソフトウェアの間のワイヤレス接続のためのこのセットアップについてまだ取り組んでいます。これは、このモデルの次のバージョンになるでしょう。このモデルの主な利点は、直接的な接触がないことです。さまざまなディープラーニングアルゴリズムが、このワイヤレスモデルでまだ取り組まれています。ハイパーパラメータのテストが行われ、モデルの効率を向上させるための取り組みが行われています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

DB-GPT プロプライエタリLLMテクノロジーを使用して、データベースとのインターフェースを変革する

DB-GPTとは何ですか? DB-GPTは、データと周囲の世界と対話するために、ローカライズされたGPT large モデルを使用した実験的...

AIニュース

「YouTubeミュージックがAIを搭載したプレイリストカスタマイズ機能を導入」

音楽愛好家にとって、YouTube Musicは画期的な機能を公開しました。最新の生成AI技術を使って、ユーザーが個別のプレイリスト...

機械学習

「AppleがオープンソースのMLフレームワーク「MLX」を発表」

機械学習の分野における協力とイノベーションを促進する重要な進展として、AppleはMLXを発表しました。MLXは、Appleの優れた...

機械学習

「ひとつのAIモデルで全てのオーディオタスクをこなせるのか?UniAudioに出会ってください:新しいユニバーサルオーディオ生成システム」

生成AIの重要な側面の1つは音声生成です。近年、生成AIの人気の高まりにより、音声制作における多様で新興のニーズがますます...

機械学習

このAIニュースレターは、あなたが必要とするすべてです #66

AIの今週のトピックスでは、OpenAIが再び注目を浴びましたChatGPTに新たな音声と画像の機能を追加する計画が発表されたからで...

機械学習

ソフトウェア開発のパラダイムシフト:GPTConsoleの人工知能AIエージェントが新たな地平を開く

変化が唯一の定数である業界で、GPTConsoleは革新的な能力を持つ3つのAIエージェントを導入しました。先頭に立つのはPixieで...