「スピーチの回復を革新する:スタンフォード主導の研究が制約のないコミュニケーションのための高性能な神経プロステーシスを公開」

Stanford-led research unveils high-performance neural prosthesis for unconstrained communication to revolutionize speech recovery.

脳コンピュータインタフェース(BCI)を用いた音声は、障害によりコミュニケーション能力を失った人々のリハビリに有望な応用がある、最先端の技術革新です。巨大な語彙から制約のないフレーズのコミュニケーションを可能にするための脳プロセスの解読はまだ初期段階ですが、初期の調査では有望性が示されています。

この空白を埋める手段として、スタンフォード大学、ワシントン大学、VA RR&D Center for Neurorestoration and Neurotechnology、ブラウン大学、ハーバード医学大学の研究チームが、大語彙の制約のない文を62語/分の速度で処理できる高性能音声テキストBCIを最近発表しました。この速度は、麻痺のある人々の通常の技術に比べて大幅に高いコミュニケーション速度です。チームは、BrainGate2パイロット臨床試験からの脳活動記録を使用し、まず運動皮質が口腔顔面運動と音声生成をどのように組織化しているかを調べました。彼らは、すべての研究対象の運動が領域6vで強くチューニングされていることを発見しました。

次に、それぞれの運動のデータが6v領域全体にどのように広がっているかを調べ、ドーサルアレイが口腔顔面運動に関する情報をより多く持っている一方、ベントラルアレイが最も信頼性の高い音声デコード率を提供していることがわかりました。それにもかかわらず、6vアレイはあらゆるタイプの動きに関する豊富なデータを提供します。最後に、3.2 3.2 mm2のアレイはすべての声優器を適切に表現できます。次に、彼らはリアルタイムでフルセンテンスを中立的に解析できるかどうかを調べました。彼らは、最小限のニューラルデータで優れた性能を発揮する再帰ニューラルネットワーク(RNN)を訓練するために、最先端の音声認識に着想を得た特注の機械学習技術を使用しました。

彼らのデータを使用すると、提案された方法は、50語のうち92%、39音素のうち62%、およびすべての口腔顔面運動のうち92%を正しくデコードすることができます。さらに、音声テキストBCIを使用して1分間に62語を達成することができます。要約すると、すべての調査対象の運動に一貫して空間的に交差したチューニングがあることから、発話の表現は麻痺と皮質表面の制限にもかかわらず、音声BCIを維持するのに十分強力であることが示されます。発話生成に関するデータの提供は、領域44が最小限のデータしか提供していないため、さらなる分析のために6v領域の記録が使用されました。

脳幹脳卒中や筋萎縮性側索硬化症などの神経系の疾患を持つ人々では、話すことや動くことが深刻に制約されるか、完全に失われることがあります。麻痺した人々は、手の動きの活動に基づいたBCIを使用して、1分間に8〜18語のタイピングができるようになりました。彼らは大いに期待されていますが、音声BCIはまだ大語彙での優れた正確さを達成していません。これは、自然なコミュニケーションの回復能力を大幅に向上させることになります。単一ニューロンの分解能を持つマイクロ電極アレイを使用して脳活動を記録することで、研究者は幅広い語彙からの伸びのない文を解析できる音声BCIを開発しました(1分間62語の速度)。これは、麻痺した人々に対する他の技術よりもはるかに高速なコミュニケーション速度を提供するBCIが初めて示されたものです。

この実験は、広範な語彙を含む話し言葉の試みをデコードするために神経スパイク活動を使用することが可能であることを示しています。ただし、システムを臨床設定で使用するためには、まだ完成度を高める必要があります。訓練時間を最小限に抑え、多日にわたる脳活動の変動に適応するためにBCIをよりユーザーフレンドリーにするためのさらなる作業が必要です。さらに、臨床設定での広範な使用に先立って、安全性と有効性についてのさらなる証拠が必要です。さらに、ここで示されたデコード結果を他の参加者で再現できるかどうか、およびそれがより重度の口腔顔面麻痺を持つ人々に適用できるかどうかは不明です。さまざまな脳構造の程度の異なる人々において、音声情報を保持する前中央回の領域が信頼性を持ってターゲットにできるかどうかを確認するためには、さらなる研究が必要です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

東京理科大学の研究者は、材料科学におけるこれまで知られていなかった準結晶相を検出する深層学習モデルを開発しました

物質における新しい結晶構造を発見する探求は、電子から製薬まで幅広い産業において重要な意味を持ち、科学的な探求の中核と...

機械学習

「シームレスM4Tに出会ってください:Meta AIの新しいスピーチ翻訳の基盤モデル」

「音声は急速に基盤モデルの次のフロンティアの一つとなっています言語やコンピュータビジョンなどの領域がまだ主流ですが、...

人工知能

「モノのインターネット」から「すべてのインターネット」へ:AIと6Gの融合によるつながる知性

「人工知能や6Gなどの最先端技術が、すべてがインターネットに接続される新しい時代を招く方法を学びましょう」

機械学習

xAIはPromptIDEを発表しました:Promptエンジニアリングと人工知能AIの透明性における新たなフロンティア

人工知能開発における画期的な一手として、xAIはPromptIDEを公開しました。PromptIDEは、プロンプトエンジニアリングと機械学...

機械学習

複雑なタスクの実行におけるロボットの強化:Meta AIが人間の行動のインターネット動画を使用して視覚的な手がかりモデルを開発する

メタAIは、先進的な人工知能(AI)研究機関であり、最近、ロボティクスの分野を革命的に変えると約束する画期的なアルゴリズ...

機械学習

Stability AIが初の日本語ビジョン言語モデルをリリース

単一かつ包括的なモデルを作成し、さまざまなユーザー定義のタスクを処理できるようにすることは、人工知能(AI)研究の分野...