「NYUとGoogle AIの研究者が、機械学習の先進的な演繹的推論のフロンティアを探る」

NYUとGoogle AIの研究者が、美容・ファッションの最新トレンドを追求する

多くの割引ルールの使用とサブプルーフの構築により、証明の複雑さは医療診断や定理の証明などの多くの論理推論の課題において無限に発展することができます。巨大な証明領域のため、すべてのサイズの保証をカバーするためのデータを見つけることは実際的ではありません。したがって、基本的な証明から始めて、一般的な推論モデルはより複雑な証明へと拡張することができるはずです。

NYUとGoogle AIの研究者のチームは、インコンテキストの学習（ICL）と思考連鎖（CoT）のプロンプトを使用してトレーニングされた場合、LLMsが論理的な推論を行うことができることを実証しました。過去の研究では、モーダスポネンスなどの一部の割引ルールが主な焦点でした。評価もデモンストレーション中であり、テストケースはインコンテキストのデモンストレーションと同じ分布から抽出されたものです。

LLMsがデモンストレーションよりも洗練された証明を一般化できる能力は、ニューヨーク大学、Google、ボストン大学の研究者による新しい研究のテーマです。学者は証明を以下の3つの次元で分類します：

デモンストレーションの各ステージで使用される前提の数。
証明を構成する一連の手順の長さ。
使用される割引ルール。

証明の総サイズはこれらの3つの次元の関数です。

このグループは、LLMsの一般的な論理的推論能力を評価するために、以前の研究を2つの重要な点で拡張しています。モーダスポネンス以外の割引ルールもマスターしているかどうかをテストします。彼らの推論能力は次の2つの方法でテストされます：

深度と幅の一般化では、インコンテキストの例よりも長い証明に対する推論が行われます。
構成的一般化では、1つの証明で多くの割引ルールを使用します。

彼らの研究によると、基本的な例を提示することで、論理的な推論タスクはインコンテキストの学習から最も利益を得ることができます。モデルが適合しすぎないようにするためには、インコンテキストの例に、証明において未知の割引の原則（例：ケースによる証明や反証による証明など）が含まれる必要があります。さらに、これらの例には迷彩要素も含まれている必要があります。

研究結果によると、CoTはLLMsにおける組成的証明へのOOB推論を引き起こすことができます。これらのLLMsには、スケールとトレーニング目標が異なるGPT-3.5 175B、PaLM 540B、LLaMA 65B、FLAN-T511Bが含まれています。この発見は驚くべきものであり、LLMsには組成的一般性がないとする文献の豊富さを考えると意外です。ICLは、インコンテキストのサンプルに対する監督学習とは異なる方法で一般化します。テスト例と同じ分布からのインコンテキストの例を与えることは明らかに悪影響です。たとえば、インコンテキストの例に特定の割引ルールが組み込まれている場合、研究者は時折、組成的証拠へのより高度な一般化が見られました。

事前学習では、モデルに仮説的なサブプルーフを作成させることはありません。具体的な例がないと、LLMsは特定の割引ルール（例：ケースによる証明や反証による証明など）を一般化することはできません。モデルのサイズとパフォーマンスの関係は弱いです。指導の調整とより長い事前学習により、より小さなモデル（最小ではなく比較可能なもの）がより大きなモデルと競合することができます。

ICLとCoTのトリガリングプロセスをさらに理解するために、研究者は今後の調査において重要な領域に注目しています。彼らは、最良のインコンテキストの例が、テスト例自体とは異なる分布から得られることを発見しました。ベイズ推論と勾配降下はこれを考慮していません。彼らは、テストケースがやや洗練されているにもかかわらず、よりシンプルな例がより良く機能するかどうかを調査することに興味を持っています。具体的なインスタンスからの外挿をさらに特徴づけるためには、追加の研究が必要です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsArtificial IntelligenceEditors PickLanguage model

Was this article helpful?

93 out of 132 found this helpful

「NYUとGoogle AIの研究者が、機械学習の先進的な演繹的推論のフロンティアを探る」

Was this article helpful?

Mixtral-8x7B スパースなエキスパートの混合理解と実行

LangChain表現言語とLLMを使用した検証実装のチェーン’ (LangChainひょうげんげんごとLLMをしようしたけんしょうじっそうのチェーン)

AI研究

Google AI研究のTranslatotron 3：革新的な教師なし音声対音声翻訳アーキテクチャの発表

ベストプロキシサーバー2023

[GPT-4V-Actと出会いましょう：GPT-4V(ision)とウェブブラウザを調和させたマルチモーダルAIアシスタント]

データの壁を破る：ゼロショット、ワンショット、およびフューショットラーニングが機械学習を変革している

「H3とPlotlyを使用してヘキサゴンマップを構築する：包括的なチュートリアル」

PoisonGPTとは：それ以外は信頼されたLLMサプライチェーンに悪意のあるモデルを導入するためのAI手法