このAIの論文は「ミスからの学習(LeMa):エラー駆動学習を通じた大規模言語モデルにおける数学的推論の強化」という題目です

「美とファッションのプロが贈る生き生きとした記事」

人間は、本質的には欠点のある存在として、成功と失敗によって特徴付けられる複雑な人生の旅を進んでいます。私たちの存在の大いなる織物の中で、間違いによって編み上げられる独自のパターンは、私たちの成長と発展に大きく寄与しています。間違いから学ぶことは、人間の経験にとって基本的であり、私たちの性格を形作り、抵抗力を育み、より啓発された未来に向かうための推進力となります。

LLMも間違いから学ぶことは可能でしょうか?可能です。GPT-3のような大規模な言語モデルは、正しい言語の使用例と誤った使用例を含む広範なデータから学習します。これらのモデルは、インターネット、本、記事などのさまざまなテキストを含む多様なデータセットでトレーニングされます。モデルはトレーニングデータのパターン、関係、文脈情報を認識します。文法、構文、意味、さらには言語の使用の微妙なニュアンスまで理解します。

このエラー駆動型学習プロセスを模倣することで、交通大学、北京大学、マイクロソフトの研究者は、GPT-4によって生成された間違い訂正データのペアを使用してLLMを微調整するLEMAを提案しています。彼らは、学生が間違いから学ぶ学習プロセスから着想を得たと述べています。

彼らの方法は、間違い訂正のデータペアを生成し、その後訂正データを使用してLLMを微調整することです。彼らは、LLaMAやGPTシリーズのモデルなどの複数のLLMを使用して、不正確な推論パスを収集し、訂正データを生成します。生成された訂正には、元の解答の間違った手順に関する3つの情報、この手順がなぜ間違っているのかの説明、正しい最終的な答えに辿り着くために元の解答をどのように訂正するかが含まれています。

彼らは、最終的な答えが間違っている訂正を除外し、このプロセスが後続の微調整段階に適切な品質を示すと述べています。彼らは、各訓練セットの質問に対してさらに多くの推論パスを生成し、誤った最終的な答えを持つパスを選別します。これにより、LLMの拡張による強力な微調整ベースラインが構築され、微調整のためのデータサイズの制御に関するさらなる削除研究が容易になります。彼らは、質問合理的なデータのみでモデルを微調整します。

CoTデータのみで微調整する場合と比較して、LEMAはさまざまなLLMおよびタスクでパフォーマンスを一貫して向上させます。LLaMA-2-70Bを使用したLEMAは、GSM8Kでは83.5%、MATHでは25.0%を達成し、CoTデータのみで微調整するとそれぞれ81.4%、23.6%です。

LLMの最近の進歩により、彼らは段階的な問題解決アプローチを実行することができるようになりました。しかしこの段階的生成プロセスが、LLMが正確な理論の基礎となる論理とルールを本当に理解しているわけではなく、単に人間の論理の表面的な振る舞いを模倣しているだけであることを暗示してはいません。LEMAは、GPT-4をワールドモデルとして使用し、小さなモデルにステップバイステップの振る舞いを単に模倣するのではなく、論理とルールに従うように教えます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「SIEM-SOAR インテグレーションによる次世代の脅威ハンティング技術」

NLP、AI、およびMLは、データ処理の効率化、自動化されたインシデント処理、コンプライアンス、および積極的な脅威検知を通じ...

機械学習

2024年のインフラストラクチャー予測

企業はAIの導入の転換点を見ているランサムウェアの脅威が罰則と衝突し、ハイブリッドクラウドアーキテクチャが主流となり、...

AI研究

ヴァンダービルト大学とUCデービスからの研究者は、学習および再構築フェーズの両方でメモリ効率の良いPRANCというディープラーニングフレームワークを紹介しました

ヴァンダービルト大学とカリフォルニア大学デービス校の研究者は、PRANCと呼ばれる枠組みを導入しました。この枠組みは、重み...

データサイエンス

AIOpsの力を解き放つ:最適化されたITオペレーションのための知的自動化によるDevOpsの強化

DevOpsのプラクティスを革命化するAIOps(ITオペレーションのための人工知能)の変革的な可能性を発見してください

機械学習

「Javaプログラミングの未来:2023年に注目すべき5つのトレンド」

この記事では、Javaプログラミングの将来について学びます2023年の最も注目すべきJavaのトレンド5つをチェックしてください

人工知能

プロンプトエンジニアリング:AIを騙して問題を解決する方法

「これは、実践的な大規模言語モデル(LLM)の使用に関するシリーズの第4回目の記事ですここでは、プロンプトエンジニアリン...