「スタンフォード大学の研究者が自然な視覚の解読を解明し、新しいモデルが目が視覚シーンを解読する方法を明らかにする」
Stanford University researchers uncover the decoding of natural vision and reveal a new model for how the eyes decode visual scenes.
感覚神経科学の分野における基本的な目標は、自然な視覚シーンを処理するのに責任のある神経コードの複雑なメカニズムを理解することです。神経科学において、未解決の基本的な問いの一つは、複数の細胞タイプの相互作用によって自然な環境で神経回路がどのように発達するのかということです。目は、様々な内在ニューロンを使って自然な視覚シーンに関する情報を伝えるために進化しており、これは視覚情報を脳に伝達するために重要です。
網膜の機能は、点滅する光やノイズなどの人工的な刺激に対してどのように反応するかという研究に基づいています。これらは実際の視覚データを網膜がどのように解釈するかを正確に表しているわけではありません。これら50種類以上の異なるタイプの内在ニューロンが網膜の処理にどのように寄与しているかの複雑さは、こうした方法を使用しても完全に理解されていません。最近の研究論文では、研究者のグループが3層のネットワークモデルが自然な風景への網膜の応答を驚異的な精度で予測する能力を持っていることを示すことで、重要な進展を遂げました。研究者たちは脳が自然な視覚シーンをどのように処理するのかを理解したかったため、脳への信号を送る目の一部である網膜に焦点を当てました。
このモデルの解釈可能性、つまり内部の組織を理解し、調査する能力は、その特徴の一つです。モデルに直接含まれている内在ニューロンの応答と、別に記録された応答との間には強い相関があります。これは、モデルが網膜の内在ニューロン活動の重要な側面を捉えていることを示しています。自然なシーンで訓練された場合、広範な動作解析、適応性、予測コーディング現象を再現することに成功します。一方、白いノイズで訓練されたモデルでは同じセットのイベントを再現することができず、自然な視覚処理を理解するためには自然な風景を調査することが必要であるという考えを支持しています。
- アリババの研究者たちは、ChatGPTのような現代のチャットボットの指示に従う能力を活用した、オープンセットの細かいタグ付けツールであるINSTAGを提案しています
- 新しい研究によって、テキストをスムーズに音声化することができるようになりました | Google
- このAI研究では、詳細な全身のジオメトリと高品質のテクスチャを持つ、リアルな3Dの服を着た人物を、単一の画像から再構築するためのテクノロジー(TeCH)を提案します
モデルの範疇細胞が行う計算は、チームによって提示された手法を用いてモデルの内在ニューロンの個々の貢献に分解されています。このアプローチにより、網膜の計算を生成するために内在ニューロンがさまざまな空間的および時間的な応答パターンと相互作用するという新しい理論が自動的に生成され、予測発生が明らかにされます。
自然な画像のシーケンスに対しては、画像は秒間30フレームの揺れを受け、1秒ごとに変更され、視網膜運動データを模倣したランダムウォークパターンが生成されました。この方法により、網膜の機能が行われる環境により似た空間時間的な刺激が生成されました。
結論として、研究チームは、正確な応答を再現するために、網膜の構造に似た3層の神経処理が重要であることを発見しました。このモデルは、実際の網膜範疇細胞が自然な画像とランダムノイズにどのように反応するかを正確に予測することに成功しました。特定の層を持つ注意深く設計されたモデルは、これらの細胞の振る舞いを正確に模倣します。したがって、この研究は、視覚システムが世界を解釈する方法を理解することを可能にし、自然な視覚に関わる複雑なプロセスに対する洞察を提供します。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「MITとハーバードの研究者が提案する(FAn):SOTAコンピュータビジョンとロボティクスシステムの間のギャップを埋める包括的なAIシステム- 任意のオブジェクトのセグメンテーション、検出、追跡、および追従のためのエンドツーエンドのソリューションを提供する」
- メタスの新しいテキストから画像へのモデル – CM3leon論文の説明
- 「ライス大学とIITカーンプールは、共同研究賞の受賞者を発表します」という文を日本語に翻訳すると、以下のようになります: 「ライス大学とIITカーンプールは、共同研究賞の受賞者を発表します」
- CMUの研究者たちは、視覚的な先行知識をロボティクスのタスクに転送するためのシンプルなディスタンスラーニングAIメソッドを開発しました:ベースラインに比べてポリシーラーニングを20%改善
- 「MITとハーバードの研究者は、脳内の生物学的な要素を使ってトランスフォーマーを作る方法を説明する可能性のある仮説を提出しました」
- Google DeepMindの研究者は、機能を維持しながら、トランスフォーマーベースのニューラルネットワークのサイズを段階的に増やすための6つの組み合わせ可能な変換を提案しています
- 「LangChainとGPT-4を使用した多言語対応のFEMAディザスターボットの研究」