「SelFeeに会いましょう:自己フィードバック生成によって強化された反復的自己修正LLM」

SelFee Reinforced Iterative Self-Correcting LLM through Self-Feedback Generation

最近の研究では、自然言語フィードバックが言語モデルの性能向上に効果的であることが示されています。KAISTの研究チームは、自己フィードバックと自己修正の生成に特化した新しいSelFeeモデルを紹介しました。従来の手法とは異なり、SelFeeは高品質な応答を生成するために外部の大規模な言語モデルやタスク固有のモデルを必要としません。

SelFeeは、単一の推論内で高品質な応答を達成するまで、回答を継続的に修正するためのファインチューニングされたLLaMAベースの指示従順モデルです。与えられた指示に基づいて、モデルは初期解と自己フィードバックシーケンスを生成します。生成されたフィードバックの内容を分析することで、モデルは修正が必要かどうかを判断します。修正が必要な場合、フィードバックに基づいて修正された回答を生成します。この反復的な修正プロセスは、既存のLLaMAベースのモデルと比較して改善された解をもたらします。

研究者たちは、ShareGPT、Alpaca、Math、Code、Flan Collectionなど、さまざまなソースから多様な指示データを収集しました。フィードバックと修正データの不足に対処するために、彼らはChatGPTという教師モデルからの蒸留プロセスを使用してデータセットを拡張しました。このアプローチにより、より手頃なコストでフィードバックと修正のインスタンスを生成することができました。

モデルをトレーニングするために、研究者たちはOpenAI APIを使用したデータ拡張技術を利用しました。彼らは複数のソースから指示を収集し、それらをChatGPTに入力して対応する回答を生成しました。次に、生成された回答に対してChatGPTにクエリを行い、フィードバックを得ました。修正が必要とされる場合、ChatGPTは自己生成のフィードバックに基づいて回答を修正しました。このプロセスは、さらなる修正が不要になるまで繰り返されました。

SelFeeはFastChatフレームワークを使用してトレーニングされました。指示に基づいて、モデルは回答とフィードバックの連鎖、修正を生成するためにファインチューニングされました。研究者たちは、推論プロセス中に必要な最小の修正を増やすことで回答の品質が向上することを観察しました。3回の修正が最も良いパフォーマンスを示し、修正の必要がない13BのSelFeeモデルよりも少なくとも3回の修正を生成する7BのSelFeeモデルの方が性能が優れていることがわかりました。

評価について、研究者たちはVicuna評価設定を採用しました。これには80の異なるクエリが含まれています。人間の評価ではなく、GPT-4を評価者として使用したパイロット評価を行いました。GPT-4の位置バイアスを考慮して、ChatGPTとの相対スコアを報告しました。

SelFeeはVicuna評価設定でChatGPTと同等のパフォーマンスを示しましたが、数学、推論、事実、コーディングなどの分野においてChatGPTと比べて知識が不足していることがわかりました。

全体的に、SelFeeは言語モデルの自己フィードバックと自己修正の生成において革新的なアプローチを提供します。モデルを継続的に回答を修正するようにファインチューニングすることで、SelFeeは既存のモデルと比較して改善されたパフォーマンスを実現します。研究の結果は、反復的な修正が言語モデルの応答の品質向上において重要であり、モデルの推論コンピューテーションを増やすことが単にサイズを増やすよりも効果的であることを示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「ADHDを持つ思春期の若者において、この深層学習研究はMRIスキャンの分析において独特な脳の変化を明らかにする:MRIスキャン分析の飛躍的な進歩」

画期的な開発により、研究者は人工知能(AI)の力を活用して、思春期の注意欠陥多動性障害(ADHD)の診断に内在する課題に取...

機械学習

ハスデックスとステーブルディフュージョン:2つのAI画像生成モデルを比較

「HasdxとStable Diffusionは、さまざまなユースケース、コスト、機能などを考慮して、最高のテキストから画像への変換モデル...

データサイエンス

自然言語処理のための高度なガイド

イントロダクション 自然言語処理(NLP)の変革的な世界へようこそ。ここでは、人間の言語の優雅さが機械の知能の正確さと出...

人工知能

AIの世界で生き残るにはどうすればいいですか?あなたの仕事は危険にさらされていますか?

あなたの仕事は危険にさらされていますか?これは多くの労働者が悩む質問ですが、最近の解雇の文脈ではありません私が言って...

データサイエンス

「OpenAIの信頼性と安全性の責任者が辞任:ChatGPTに与える影響は何ですか?」

OpenAIという先駆的な人工知能企業では、ChatGPTなどの革新的な技術により、世界に生成型AIを紹介しました。LinkedInでの最近...

データサイエンス

「関係深層学習ベンチマーク(RelBench)に出会ってください:関係データベース上の機械学習のためのリアルな、大規模で多様なベンチマークデータセットのコレクション」

人工知能(AI)と機械学習(ML)の急速な進歩の分野において、効果的で自動化され、適応性のある手法を見つけることは非常に...