「I2D2に会ってください：制約付きデコーディングと自己模倣学習を用いた言語モデルからの汎用知識生成のための新しいAIフレームワーク」

I2D2 A New AI Framework for General Knowledge Generation from Language Models using Constrained Decoding and Self-Imitation Learning

言語モデルの急速な進歩は、主にその巨大なスケールによるものであり、様々な自然言語処理のタスクで驚異的な能力を実現しています。しかし、考察を促す疑問が生じます：スケールはモデルのパフォーマンスの唯一の決定要因なのでしょうか？最近の研究はこの考えを挑戦し、現在利用可能な最大のモデルと競争できるかどうか、そのサイズが小さいものであっても、小さいモデルが優れた性能を発揮できるかを調査しています。革新的な蒸留、制約デコーディング、自己模倣学習アルゴリズムを活用し、研究はI2D2と呼ばれる画期的なフレームワークを提案し、100倍も大きなモデルよりも優れた性能を発揮する小さい言語モデルを実現しています。

I2D2による小さいモデルの強化

小さい言語モデルが直面する主な課題は、比較的低い生成品質です。I2D2フレームワークは、2つの主要なイノベーションによってこの障害を克服します。まず第一に、神経言語デコーディングを用いて制約付き生成を行い、生成品質のわずかな改善をもたらします。さらに、フレームワークは低品質の生成物を除外する小さな評価モデルを組み込み、性能の大幅な向上を実現します。評価モデルによるフィルタリング後に得られた高品質な生成物を用いて、言語モデルは自己模倣ステップで微調整されます。重要なことは、これらの手順を反復的に適用することで、小さい言語モデルの性能を持続的に向上させることができるということです。

常識的な知識の生成への適用

日常の概念に関する常識的な知識の生成の文脈において、I2D2フレームワークは印象的な結果を示しています。他のアプローチがGPT-3の生成物に依存するのに対して、I2D2は独立して成立します。GPT-3よりも100倍小さいモデルに基づいているにもかかわらず、I2D2は高品質な一般的な常識的知識のコーパスを生成します。

大きなモデルを凌駕する

比較分析によると、I2D2は一般的な生成物を生成する際の正確さにおいてGPT-3を凌駕します。GenericsKBに存在する一般的な生成物の正確さを検証することで、GPT-3とI2D2の正確さのレベルの比較から、I2D2がより高い正確さを達成していることが明らかになります。このフレームワークの評価モデルは、真偽の判断を下す際に真実と偽の常識的な文を見分けることで、GPT-3を上回ります。

多様性の向上と反復的な改善

正確さの向上に加えて、I2D2はGenericsKBと比較してより多様な生成物を示します。生成されるコンテンツは10倍も多様であり、自己模倣の連続的な反復によってさらに改善されます。これらの結果から、I2D2は競合するモデルよりも100倍も小さいモデルを利用して、正確かつ多様な一般的な文を生成する強健性を示していることがわかります。

研究の意義

この研究の主要な発見は、自然言語処理において小さいかつ効率的な言語モデルが大きな改善の可能性を持っていることを示しています。I2D2で導入されたような革新的なアルゴリズム技術を用いることにより、小さいモデルは特定のタスクにおいて大きなモデルのパフォーマンスに匹敵することができます。さらに、この研究は、自己改善が大規模な言語モデルにのみ特有のものであるという考えに挑戦し、I2D2が小さいモデルの自己イテレーションと生成品質の向上の能力を示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

AI ShortsApplicationsArtificial IntelligenceEditors PickLanguage modelLarge Language ModelMachine learningStaffTech NewsTechnologyUncategorized

Was this article helpful?

93 out of 132 found this helpful

「I2D2に会ってください：制約付きデコーディングと自己模倣学習を用いた言語モデルからの汎用知識生成のための新しいAIフレームワーク」

Was this article helpful?

チャットGPTからPiへ、そしてなぜそうするのかをお伝えします！

「ベクトルデータベースの力を活用する：個別の情報で言語モデルに影響を与える」

機械学習

「生成型AIのGPT-3.5からGPT-4への移行の道程」

ビジネスにおけるオープンソースと専有モデルの選択：生成型人工知能の展開において

「研究データ管理の変革：AIの役割によるデベロッパーのエンパワーメント」

「AIガバナンスの12のコア原則」

「医療分野における生成型AI」

ワンダーダイナミックスの使い方：自分自身を3Dキャラクターに変身させる方法