「脳のように機能するコンピュータビジョンは、人々が見るように見ることができます」

Computer vision that functions like the brain can see as people see.

研究者たちは、コンピュータビジョンモデルをより頑健にするため、人間や他の霊長類が物体認識に頼っている脳の一部と同様に機能するようにトレーニングしました。 ¶ クレジット:iStock

マサチューセッツ工科大学のジェームズ・ディカルロと彼の同僚は、人間や霊長類の脳の下位頭領域(IT)皮質に似たように人工ニューラルネットワークをトレーニングし、コンピュータビジョンを改善しました。

研究者たちは、霊長類の視覚処理ニューロンからのニューラルデータに基づいてコンピュータビジョンモデルを構築し、オブジェクトを認識するように課題を与えました。

ディカルロは、これにより人工ニューラル回路が視覚情報を異なる方法で処理するようになったと述べています。

研究者たちは、神経学的に合致したモデルのIT層が、ニューラルデータのトレーニングがない同じサイズのネットワークモデルよりもITニューラルデータとより一致していることを発見しました。

彼らはまた、神経学的に合致したモデルが、コンピュータビジョンおよび人工知能システムの評価に対する敵対的攻撃に対してより強靭であることを発見しました。MITニュースから全文記事を表示

要約の著作権は2023年SmithBucklin、ワシントンD.C.、アメリカに帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

RAGのNLPにおける検索と生成の統一的な革新的アプローチ

イントロダクション AIの急速に進化する領域に、ゲームチェンジングなイノベーションが登場し、機械が人間の言語と関わる方法...

AI研究

「DevOps 2023年の状況報告書:主要な調査結果と洞察」

年次調査の結果が発表されました画期的な発見がありますこのレポートは、AIとドキュメンテーションが生産性と仕事の満足度に...

機械学習

「LangChainとは何ですか?利用事例と利点」

LangChainはプログラマが大規模言語モデルを用いてアプリケーションを開発するための人工知能フレームワークです。ライブラリ...

データサイエンス

「Langchainとは何ですか?そして、大規模言語モデルとは何ですか?」

この包括的な記事では、LangChainとLarge Language Modelsの両方を探求します両方を理解するために、簡単なチュートリアルを...

機械学習

「FlexGenに会おう:GPUメモリが限られている場合に大規模な言語モデル(LLM)を実行するための高スループットな生成エンジン」

大規模言語モデル(LLM)は最近、さまざまなタスクで印象的なパフォーマンスを発揮しています。生成型LLMの推論は以前にない...

データサイエンス

AIの導入障壁:主要な課題と克服方法

人工知能(AI)がビジネスを革新し、効率を高め、生産性を向上させる方法を発見してくださいAI導入の障壁について議論します