『プロンプトブリーダーの内部:Google DeepMindの新しい自己改善プロンプト技術』

『美容・ファッションのエキスパートによる鮮やかな記事:プロンプトブリーダーの内部観察からGoogle DeepMindの新しい自己改善プロンプト技術まで』

その方法は進化的アルゴリズムをプロンプト最適化と組み合わせて驚異的な結果を達成します。

Midjourneyを使用して作成

私は最近、既に16万人以上の購読者を持つAIに焦点を当てた教育のニュースレターを始めました。TheSequenceは、ハイプやニュースなどがない、5分で読めるML指向のニュースレターです。その目標は、機械学習のプロジェクト、研究論文、概念について最新の情報を提供することです。以下の購読ボタンからぜひ試してみてください:

TheSequence | Jesus Rodriguez | Substack

機械学習、人工知能、データの進展について最新情報を得るための最高のソース…

thesequence.substack.com

推論とプロンプトの進化/最適化は、大規模な言語モデル(LLM)における次の重要なフロンティアとして認識されています。AutoGPTやBabyAGIのようなプロジェクトには、プロンプトを定期的に進化させて推論に近い方法で特定の目標を達成するという魅力的なものがあります。LLMの推論能力を向上させるために使用されるさまざまなストラテジーの中でも、Chain-of-Thought Promptingはその効果的な方法として称賛されています。ただし、手動で作成されたプロンプト戦略は、最適なパフォーマンスには到達しない傾向があることに注意する価値があります。

最近、Google DeepMindの研究者は、PROMPTBREEDERという自己改善型のプロンプトアルゴリズムを発表しました。このアルゴリズムは進化的手法を使用して、特定のタスクに対して最適なプロンプトを導き出します。PROMPTBREEDERは、CoTの制約をいくつか解消し、自己参照的な方法でプロンプトを改善します。

基盤となる概念

Google DeepMindによって開発されたPROMPTBREEDERの概念は、新興の研究分野からインスピレーションを受けています:

1. プロンプト戦略: Chain-of-Thought Prompting(CoT)は広く採用された手法として目立っています。これにより、LLMに対して少数のショットプロンプトを提供することで、算術、常識、および象徴的な推論の改善が実現されます。特にパワフルなLLMに対して効果があります。

2. 自己参照的な自己改善: 自己改善可能なオープンエンドシステムの作成と、自己の改善方法を向上させることは、AI研究における長年の課題となっています。この領域で人気のあるテクニックの一つは、内省的なニューラルネットワークにおける自己参照的な重み行列です。これにより、重みを変更することが可能となります。この概念のよりスケーラブルなバージョンは、2022年に入江らによって提案されています。

3. オープンエンデッドとLLM: PROMPTBREEDERは、LLMが例から変動を生成し、新規性を定量化する能力を持っているという考えに基づいています。他のシステムとは異なり、Promptbreederはプロンプトの領域を自律的に探索します。「データから学習」から「どのデータから学習するかを学習する」への移行を意味します。

さらに深く掘り下げる

PROMPTBREEDERはLLMにおける自己参照的な自己改善と考えることができます。Promptbreederの作業プロセスは以下のように要約されます:

1. タスクプロンプトの変異: PROMPTBREEDERは、タスクプロンプトの集団から始まり、それらに変異を加えることでさまざまなバリアントを生成します。

2. フィットネス評価: これらの変更されたタスクプロンプトの適合性は、トレーニングデータセットを使用して評価されます。LLMがこれらのプロンプトに効果的に応答するかどうかを測定します。

3. 継続的な進化: この変異と評価のプロセスは、生物学的進化に類似していくつかの世代にわたって反復されます。

画像のクレジット:Google DeepMind

問題の説明に直面し、一連の一般的な「思考スタイル」と突然変異促進が備わった状態で、PROMPTBREEDERはダイナミックなプロセスを開始します。このプロセスにより、進化的な単位の集団が生まれます。これらの単位は通常、2つのタスクプロンプトと1つの突然変異プロンプトで構成されています。

プロンプトの進化を追求するために、PROMPTBREEDERは2011年にハービーによって開発された、確立されたバイナリトーナメント遺伝アルゴリズムフレームワークを採用しています。タスクプロンプトの優位性を測定するため、そのパフォーマンスはトレーニングデータのランダムな選択に対して検証されます。

PROMPTBREEDERは複数の世代にわたって変容の旅に出ます。タスクプロンプトと突然変異プロンプトに変異を導入し、5つの異なるクラスの突然変異演算子を利用します。この進化の旅は、特定のドメインにより適応性が高いタスクプロンプトの出現を促し、同時に突然変異プロンプトを自己言及プロセスを通じて徐々に洗練させます。

PROMPTBREEDERは変異プロンプトのシードセット、思考スタイル、特定のドメインの問題の説明を活用して、タスクプロンプトと突然変異プロンプトを生成します。LLMは突然変異演算子として利用されます。複数の世代にわたって、PBはプロンプトが特定のドメインに適応する様子を観察し、数学、常識的な推論、算術、倫理などのさまざまな領域での効果を示しています。

画像クレジット: Google DeepMind

一部の既存のプロンプト手法(Chain-of-Thoughtなど)とは異なり、PROMPTBREEDERは自己言及的な自己改善のためのパラメータの更新を必要としません。このアプローチは、より大きく能力の高いLLMがその利点をさらに増幅できる有望な未来を示唆しています。

PROMPTBREEDERの基盤は、LLMが入力テキストのバリエーションを生成できる能力に基づいています。タスクプロンプトは、LLMが後に入力を続ける際により良い応答をするために使用される文字列です。タスクプロンプトを評価するために、関連するドメインのトレーニングセットからのQ&Aペアのバッチがサンプリングされます。Promptbreederは進化アルゴリズムを採用し、突然変異演算子は突然変異プロンプトに応じて制約のあるLLMです。

PROMPTBREEDERの興味深い側面の一つは、自己言及メカニズムです。このメタレベルのアルゴリズムは、突然変異プロンプトを進化させるためにハイパーミューテーションプロンプトに基づくLLMを活用します。このプロセスは、突然変異したタスクプロンプトの集団を初期化することから始まります。各進化の単位には、タスクプロンプトのセット、突然変異プロンプト、そして場合によっては正しい作業のセットが含まれます。

まとめると、PROMPTBREEDERは自己言及的な自己改善を通じて大規模言語モデルの能力を向上させる有望なアプローチを提案しています。そのポテンシャルは、自律的にプロンプトを進化させ、特定のドメインに適応し、定数のパラメータ更新が必要なく、より効率的で能力の高いLLMへの道を提供するという点にあります」。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

APIワールド2023:API、AI、および秘密のセキュリティを結集する

「API World 2023は、ベストプラクティスの洞察を共有し、すべての資産を考慮すること、そしてAPI駆動型の世界におけるAIとAP...

機械学習

このAI論文は、概念関連伝播(CRP)を用いて、「どこ」や「何」を解き明かすための深層学習モデルの理解に新たなアプローチを提案しています

“`html 機械学習と人工知能の分野は非常に重要になっています。日々進歩している新たな技術があります。この領域はあら...

機械学習

レオナルドAI:Midjourneyの新たな競合相手

レオナルドAIは、ミッドジャーニーがこれまで築いてきた地位に挑戦する注目すべき代替手段として徐々に浮上しています

AI研究

『広範な展望:NVIDIAの基調講演がAIの更なる進歩の道を指し示す』

ハードウェア性能の劇的な向上により、生成型AIが生まれ、将来の高速化のアイデアの豊富なパイプラインが構築され、機械学習...

データサイエンス

「ZoomがAIトレーニングのために顧客データを使用することで法的ジレンマに直面」

新たな出来事の展開により、人気のあるビデオ会議プラットフォームであるZoomが、顧客データを人工知能(AI)モデルのトレー...

機械学習

「ChatGPTとBard AIを活用するために、ソフトウェア開発者はどのように役立つことができるのでしょうか?」

以前は、開発者はコードやデバッグに多くの時間を費やしていましたが、今ではChatGPTやBard AIのおかげで、ソフトウェアエン...