Search Results ML

AIにおける意識の可能性の評価：神経科学理論に基づく指標特性の科学的探求

AIシステムが意識を持つ可能性は現在の注目のトピックです。トップの研究者たちは、人間の意識に関連する脳のプロセスからインスピレーションを得て、AIの能力を向上させています。AIの進歩は驚くほど速いものです。一方で、人間の話し言葉を正確に模倣するAIシステムを開発することは、ユーザーの間で意識を持つAIシステムの認識が高まる可能性があるでしょう。彼らはこの研究で、AIの意識を評価する最良の方法は、意識の神経科学的理論を参照することだと主張しています。彼らはこのタイプのよく知られたアイデアを検討し、それがAIにどのような影響を与えるかを調査しています。彼らはこの報告書に対して以下の主な貢献を考えています： 1. 意識をAIで評価することが科学的に追跡可能であり、意識は科学的に調査できるため、この研究の結果がAIに適用できることを示す 2. 現在の技術を使用して、多くの指標的特性をAIシステムに実装できるという予備的な証拠を提供する。ただし、意識の強い候補は見つかっていません。 3. 科学的理論から派生した指標的特性のリストとしてのAIの意識を評価するための基準を概説する。彼らは、研究の進展に伴い、含める指標的特性のリストが変化することを期待しており、提供する基準は仮のものとなるでしょう。彼らはAIの意識を研究するために3つの基本原則を使用しています。作業仮説として、彼らは計算的汎用性を受け入れています。これは、適切な計算が理解に必要であり十分であるという考えです。この主張は、現代哲学的思考の中心的な考え方ですが、議論の的となっています。彼らは、理論的にはAIの意識が可能であり、AIシステムの内部機能を研究することが意識の有無を理解するために重要であるという理由から、この理論を受け入れています。これは、計算的汎用性がAIの意識に与える影響について考える上で有用です。第二に、彼らは神経科学に基づく意識の理論が実証的に妥当であり、人工知能の意識を評価するために使用できると主張しています。計算的汎用性は、AIの意識において類似した機能が十分であるとされることを示唆しています。これらの理論は、人間の意識において必要かつ十分な機能を見つけようとしています。第三に、AIの意識を調査するための最良の戦略は、理論重視の戦略だと彼らは主張しています。これには、科学的理論に基づいてAIシステムが意識に関連するタスクを実行しているかどうかを判断し、これらの理論の信憑性を以下の基準に基づいて判断することが含まれます：機能の類似性。それらを支持する証拠の強さ。計算的汎用性への信念。この戦略への主な代替案は、行動的な意識のテストです。ただし、この戦略は信頼性が高いかもしれません。なぜなら、AIシステムは異なる方法で動作しながらも人間の行動を模倣するように訓練される可能性があるからです。彼らはこの文脈で特定の理論を支持していません。なぜなら、意識の科学にはいくつかの仮説が存在するからです。代わりに、彼らは意識の理論の研究から指標のリストを収集しています。各指標の品質が意識にとって必要不可欠であり、その一部が十分であると複数の理論が主張しています。ただし、彼らは、より多くの指標的特性を持つAIシステムの方が意識を持つ可能性が高いと主張しています。現在のまたは計画中のAIシステムがこれらの特徴を持っているか、持つ予定があるかどうかを評価することで、それが意識の真剣な候補であるかどうかを判断することができます。彼らは計算的高次理論、グローバルワークスペース理論、再帰処理理論など、いくつかの科学的なアイデアについて取り上げています。また、計算的汎用性とは互換性がないため、統合情報理論は考慮していません。さらに、彼らはエージェンシーと具体性が指標であると考えています。ただし、これらを示唆する計算的側面で理解することが重要です。彼らは、グローバルワークスペースのアイデアに基づいて、PerceiverアーキテクチャやTransformerベースの大規模言語モデルなどを検討しています。また、仮想的なネズミの体を操作することでタスクを完了することを教えられたシステムである「エンボディドマルチモーダル言語モデル」と呼ばれるPaLM-Eや、3D仮想環境で動作する強化学習エージェントであるDeepMindのAdaptive Agentも調査されています。彼らは、エージェンシーと具体性に関連する指標的特性を示すために、これらの3つのシステムを事例研究として使用します。このPre-Print Paperをご覧ください。この研究に関するすべてのクレジットは、このプロジェクトの研究者に帰属します。また、最新のAI研究ニュースや魅力的なAIプロジェクトなどを共有する29k+のML SubReddit、40k+のFacebookコミュニティ、Discordチャンネル、メールニュースレターにぜひ参加してください。 Hostinger AIウェブサイトビルダー：使いやすいドラッグアンドドロップエディター。今すぐお試しください（スポンサード） 1/8 私たちの新しいプレプリントを発表して興奮しています。これは、神経科学の主要な理論の観点からAIにおける意識の問題を考察しています。哲学、神経科学、AIの分野から多岐にわたる共同研究です！https://t.co/rLm78YNfJk…

「生成AIの余波におけるオープンソースAIの戦い」

テックジャイアントやAI実践者がリスクと報酬を考慮しながら、オープンソースAIの議論の進化する性質について学びましょう

「MITのこのAI研究は、光を基にした機械学習システムがより強力で効率的な大規模言語モデルを生み出す方法を示しています」

ディープニューラルネットワーク（DNN）は、コンピューターにとってスーパーブレインのような存在です。彼らは多くの情報からトリッキーなものを見つけ出すのが得意です。彼らはコンピューターに画像を理解させ、人間のように話し、自動車を自動運転させ、さらには医師が病気を見つけるのを助けるほど賢くなることができます。 DNNは、私たちの脳がどのように働くかを模倣しており、それによって、通常のコンピュータープログラムが苦労する難しい問題を効率的に解決することができます。しかし、現在のディープニューラルネットワーク（DNN）の基盤となるデジタル技術は、その能力の限界に直面しており、一方で機械学習の分野は拡大し続けています。さらに、これらの技術は膨大なエネルギー消費を要求し、広範なデータセンターに制約されています。この状況から、新しい計算アプローチの発見と創造が生まれるようになりました。その結果、MITの研究者たちはこの状況の改善に多大な努力を注いできました。MITを率いるチームは、ChatGPTを駆動する機械学習プログラムの能力を数段上回る可能性を持つシステムを巧妙に考案しました。この新たに開発されたシステムは、現代の機械学習モデルを駆動する最先端のスーパーコンピューターよりもはるかに少ないエネルギーを消費するという驚異的な利点も持っています。このシステムは、数百のマイクロンスケールレーザーを用いた光の操作によって実現されています。研究者たちは、この技術が大規模な光電子プロセッサーの実現につながり、データセンターから分散型エッジデバイスまでの機械学習タスクの加速を可能にする道を開いたと強調しています。言い換えれば、現在は大規模なデータセンターでのみ計算可能なプログラムを、携帯電話やその他の小型デバイスでも実行できるようになるかもしれません。光計算は、電子に比べてはるかに少ないエネルギーを消費します。光は、はるかに小さな空間に対してはるかに多くの情報を伝えることができます。このイニシアチブのリーダーであるMIT電気工学およびコンピューターサイエンス学科の准教授であるDirk Englundは、現在のスーパーコンピューターの能力がChatGPTのサイズを制約していると述べています。経済的な要因により、はるかに大きなモデルの訓練の実現可能性は限られています。彼らが開拓したこの技術は、今後数年間においてはアクセスできないままであるはずの機械学習モデルの利用を可能にすることができます。彼はさらに、もし100倍の能力を持つ次世代のChatGPTが実現した場合、その能力についてはまだ決定中であるが、このような技術が許容する発見の領域であると述べています。光ニューラルネットワークの利点にもかかわらず、現在の光ニューラルネットワーク（ONN）には重要な課題もあります。たとえば、電力に基づいて入力データを光に変換するのが非効率であるため、多くのエネルギーが必要です。さらに、これらの操作に必要なコンポーネントは大きく、かなりのスペースを占有します。加算などの線形計算に長けたOptoelectronic Neural Networks（ONNs）ですが、乗算や条件文などの非線形計算には制約があります。この研究に関する論文とMITブログをご覧ください。この研究に関するすべてのクレジットは、このプロジェクトの研究者に帰属します。また、最新のAI研究ニュースや素敵なAIプロジェクトなどを共有している、2,900人以上のML SubReddit、40,000人以上のFacebookコミュニティ、Discordチャンネル、およびメールニュースレターにぜひご参加ください。 Hostinger AI Website Builder：使いやすいドラッグアンドドロップエディター。今すぐお試しください（提供）この記事はMarkTechPostで最初に掲載されたものです。

モンテカルロ近似法：どれを選び、いつ選ぶべきか？

確率モデルでは確定的な推論がしばしば非効率であるため、数値サンプリングに基づいた近似手法であるモンテカルロに注目します

「AIの問題を定義する方法」

「25年以上のソフトウェアエンジニアリングの経験を持っていますので、人工知能（AI）と機械学習を始めるソフトウェア開発者からの質問に多く答えてきました…」

「慢性腎臓病の予測：新しい視点」

「腎臓は、血液から廃物、毒素、余分な水分を取り除くために一生懸命働きますその適切な機能は健康にとって重要です慢性腎臓病（CKD）は、…」

「より良い機械学習システムの構築 – 第3章：モデリング楽しみが始まります」

こんにちは、お帰りなさいまたここでお会いできてうれしいですあなたがもっと良いプロフェッショナルになりたいという意欲、より良い仕事をしたいという願望、そしてより良いMLシステムを構築したいということを本当に感謝していますあなたは素晴らしいです、これからも頑張ってください！このシリーズでは、私は...

「キャリアのために右にスワイプ：仕事のためのTinderを作る」

「幅広い雇用の世界で完璧な仕事や候補者を見つけることは、ハンニンを干し草の中から見つけるよりも難しいと知っていますか？心配しないでください、親愛なる読者の皆さん、私たちは今、探求の旅に乗り出す準備をしています...」

ウェブデータ駆動型製品をスケーリングする際に知っておくべきこと

データ駆動型の製品をスケーリングすることは、ビジネスの成長に役立ちますが、特定の専門知識が必要ですこの記事では、スケーリングの仕組みと、それを行う際に注意すべきことについて学ぶことができます

Data Engineering

感情の解読：EmoTXによる感情と心の状態の明らかにする、新しいTransformer-Powered AIフレームワーク

映画は物語や感情の中でも最も芸術的な表現の一つです。たとえば、「ハッピネスの追求」では、主人公が別れやホームレスなどの低い状況から、一流の仕事を達成するなどの高い状況まで、様々な感情を経験します。これらの強烈な感情は、観客を引き込み、キャラクターの旅に共感することができます。人工知能（AI）の領域でこのような物語を理解するためには、キャラクターの感情や心理状態の変化を監視することが重要です。この目標は、MovieGraphsからの注釈を活用し、シーンを観察し、対話を分析し、キャラクターの感情や心理状態に関する予測を行うことで追求されます。感情の対象は歴史を通じて幅広く探求されてきました。古代ローマのキケロの四分類から現代の脳研究まで、感情の概念は常に人類の関心を引きつけてきました。心理学者たちは、プルチキの車輪やエクマンの普遍的な顔の表情などの構造を導入することで、さまざまな理論的な枠組みを提供しました。感情は、感情、行動、認知の側面と身体的な状態を包括する心理状態にさらに分類されます。最近の研究では、Emoticとして知られるプロジェクトが視覚コンテンツの処理時に26の異なる感情ラベルクラスターを導入しました。このプロジェクトは、画像が平和や関与など、同時にさまざまな感情を伝える可能性があることを許容するマルチラベルのフレームワークを提案しました。従来のカテゴリーのアプローチに代わり、この研究では連続的な3つの次元（快感、興奮、支配）も組み込まれています。正確な感情の予測には、さまざまなコンテキストモダリティを網羅する必要があります。マルチモーダルな感情認識の主要なアプローチには、対話の中での感情認識（ERC）が含まれます。これにより、対話の交換ごとに感情を分類することができます。また、映画クリップの短いセグメントに対して単一の快感-活動スコアを予測するアプローチもあります。映画のシーンレベルでの操作は、特定の場所で発生し、特定のキャストを含む、30から60秒の短い時間枠内で物語を伝える一連のショットと一緒に作業することを意味します。これらのシーンは個々の対話や映画クリップよりも長い時間を提供します。この目標は、シーン内のすべてのキャラクターの感情と心理状態、およびシーンレベルでのラベルの蓄積を予測することです。時間の長いウィンドウが与えられるため、この推定は自然にマルチラベル分類アプローチにつながります。キャラクターは同時に複数の感情（好奇心と混乱など）を伝える場合がありますし、他者との相互作用による遷移（たとえば、心配から穏やかに変化する）も起こる可能性があるためです。さらに、感情は心理状態の一部として広く分類されることができますが、この研究では、キャラクターの態度（驚き、悲しみ、怒りなど）から明確に認識できる外部の感情と、相互作用や対話を通じてのみ識別可能な潜在的な心理状態（礼儀、決意、自信、助け）とを区別しています。著者たちは、広範な感情ラベル空間で効果的に分類するためには、マルチモーダルなコンテキストを考慮する必要があると主張しています。そのため、彼らはビデオフレーム、対話の発話、キャラクターの外観を同時に組み込むモデルであるEmoTxを提案しています。このアプローチの概要は、以下の図に示されています。 https://arxiv.org/abs/2304.05634 EmoTxは、キャラクターごとおよび映画シーンごとに感情を特定するためにTransformerベースのアプローチを使用しています。プロセスは、初期のビデオの前処理と特徴抽出パイプラインから始まり、データから関連する表現を抽出します。これらの特徴には、ビデオデータ、キャラクターの顔、テキストの特徴が含まれます。この文脈では、モダリティ、キャラクターの列挙、および時間的なコンテキストに基づいて区別するための適切な埋め込みがトークンに導入されます。さらに、個々の感情の分類器として機能するトークンが生成され、シーンまたは特定のキャラクターにリンクされます。これらの埋め込まれたトークンは、線形層を使用して組み合わされ、Transformerエンコーダに供給されます。これにより、さまざまなモダリティ間での情報の統合が可能になります。この方法の分類コンポーネントは、以前のTransformerを用いたマルチラベル分類に関する研究から着想を得ています。「EmoTx」の振る舞いの例は、著者によって公開され、「フォレスト・ガンプ」のシーンに関連しています。以下の図に報告されています。 https://arxiv.org/abs/2304.05634 これは、適切なマルチモーダルデータからビデオクリップに登場する被験者の感情を予測する、新しいAIベースのアーキテクチャ「EmoTx」の概要でした。興味がある場合は、以下に引用されたリンクを参照して詳細をご覧ください。

Learn more about Search Results ML - Page 291