UCSFとUC Berkeleyの研究者たちは、脳幹の脳卒中による重度の麻痺を持つ女性がデジタルアバターを通じて話すことができるようにする脳-コンピューターインタフェース（BCI）を開発しました

UCSF and UC Berkeley researchers have developed a brain-computer interface (BCI) that enables women with severe paralysis from brainstem stroke to communicate through a digital avatar.

人工知能は今日では音声と顔の認識に重要な役割を果たしています。これらの信号は脳の信号によって記録・合成され、AIの劇的な利用を可能にしています。この技術は、これらの信号をテキストにエンコード・デコードすることも、驚くほどの速度で行うことができます。これにより、システムはさらに強力になります。これらの音声と顔の認識の技術は、自然言語処理という広範なカテゴリに属しています。研究者たちはまだ、麻痺した人々のために音声と顔の認識を可能にするAIを探し続けています。

UCサンフランシスコ大学とUCバークレー大学の研究者たちは、脳-コンピュータインターフェースを開発しました。これは、脳の電気的なインパルスと外部デバイス（おそらくはロボットまたはAIチャットボット）との直接的な通信経路とも呼ばれます。麻痺した女性でさえデジタルアバターと会話できるという結果が示されています。これらの研究者は、他の人との最も自然なコミュニケーション方法である強力なコミュニケーション体を埋め込むことを目指しています。AIは、麻痺や話すことができない患者に対する解決策を提供しました。研究者たちは、音声認識に重要な役割を果たす、女性の体表面に長方形の電極を実装しました。これらの電極は、彼女の体を伝わる脳信号またはインパルスを実装し、彼女の認識を容易に利用できるようにしました。研究者たちは、モデルを訓練し、システムが使用する人工知能アルゴリズムを改善することで、システムの正確性を向上させました。これには、異なるフレーズを何度も繰り返し使用し、システム内のNLPのワードバッグモデルを使用しました。研究者たちはまた、AIモデルをトレーニングして、これらの単語を音素に認識・エンコードすることもできるようにしました。これにより、システムの正確性が向上し、以前よりも速くなりました。

研究者たちは、彼女の結婚式の録音声を使用して彼女の声を生成するためのアルゴリズムを開発しました。生成された音声にはいくつかの欠陥がありましたが、後に研究者たちは以前に生成された声の品質を改善するために取り組みました。これらの研究者はまた、女性の顔認識に役立つデジタルアバターも開発しました。研究者たちはまた、女性の脳信号とアバターを統合する機械学習モデルも作成しました。これにより、彼女の顎、唇、舌、口などのすべての動きが記録されました。

研究者たちは、人体とソフトウェアの間のワイヤレス接続のためのこのセットアップについてまだ取り組んでいます。これは、このモデルの次のバージョンになるでしょう。このモデルの主な利点は、直接的な接触がないことです。さまざまなディープラーニングアルゴリズムが、このワイヤレスモデルでまだ取り組まれています。ハイパーパラメータのテストが行われ、モデルの効率を向上させるための取り組みが行われています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsArtificial IntelligenceEditors PickMachine learningStaffTech NewsTechnologyUncategorized

Was this article helpful?

93 out of 132 found this helpful

UCSFとUC Berkeleyの研究者たちは、脳幹の脳卒中による重度の麻痺を持つ女性がデジタルアバターを通じて話すことができるようにする脳-コンピューターインタフェース（BCI）を開発しました

Was this article helpful?

2023年9月にチェックすべき40以上のクールなAIツール

「MMDetectionを使用して物体検出モデルのトレーニング方法を学びましょう」

AI研究

KITE（キーポイントを視覚的な基盤と正確なアクション推論の表現として使用する意味操作のためのAIフレームワーク）に会いましょう

「イェール大学とGoogleの研究者が、効率的な長距離シーケンス処理のために大規模言語モデルを迅速に加速する近似Attentionメカニズム、HyperAttentionを紹介する」という文章です

「MITキャンパスでのAIパイロットプログラムは、エネルギー使用量と排出物を削減することを目指しています」

デシAIは、DeciDiffusion 1.0を公開しました：820億パラメータのテキストから画像への潜在的拡散モデルで、安定した拡散と比べて3倍の速度です

「イデオグラムはテキストから画像への変換をどのように革新するのか？ DALL-EやMidjourneyを超えるAIプラットフォームが文字を生成する」

「OpenAIが企業向けAIの扉を開放」