『プロンプトブリーダーの内部:Google DeepMindの新しい自己改善プロンプト技術』

『美容・ファッションのエキスパートによる鮮やかな記事:プロンプトブリーダーの内部観察からGoogle DeepMindの新しい自己改善プロンプト技術まで』

その方法は進化的アルゴリズムをプロンプト最適化と組み合わせて驚異的な結果を達成します。

Midjourneyを使用して作成

私は最近、既に16万人以上の購読者を持つAIに焦点を当てた教育のニュースレターを始めました。TheSequenceは、ハイプやニュースなどがない、5分で読めるML指向のニュースレターです。その目標は、機械学習のプロジェクト、研究論文、概念について最新の情報を提供することです。以下の購読ボタンからぜひ試してみてください:

TheSequence | Jesus Rodriguez | Substack

機械学習、人工知能、データの進展について最新情報を得るための最高のソース…

thesequence.substack.com

推論とプロンプトの進化/最適化は、大規模な言語モデル(LLM)における次の重要なフロンティアとして認識されています。AutoGPTやBabyAGIのようなプロジェクトには、プロンプトを定期的に進化させて推論に近い方法で特定の目標を達成するという魅力的なものがあります。LLMの推論能力を向上させるために使用されるさまざまなストラテジーの中でも、Chain-of-Thought Promptingはその効果的な方法として称賛されています。ただし、手動で作成されたプロンプト戦略は、最適なパフォーマンスには到達しない傾向があることに注意する価値があります。

最近、Google DeepMindの研究者は、PROMPTBREEDERという自己改善型のプロンプトアルゴリズムを発表しました。このアルゴリズムは進化的手法を使用して、特定のタスクに対して最適なプロンプトを導き出します。PROMPTBREEDERは、CoTの制約をいくつか解消し、自己参照的な方法でプロンプトを改善します。

基盤となる概念

Google DeepMindによって開発されたPROMPTBREEDERの概念は、新興の研究分野からインスピレーションを受けています:

1. プロンプト戦略: Chain-of-Thought Prompting(CoT)は広く採用された手法として目立っています。これにより、LLMに対して少数のショットプロンプトを提供することで、算術、常識、および象徴的な推論の改善が実現されます。特にパワフルなLLMに対して効果があります。

2. 自己参照的な自己改善: 自己改善可能なオープンエンドシステムの作成と、自己の改善方法を向上させることは、AI研究における長年の課題となっています。この領域で人気のあるテクニックの一つは、内省的なニューラルネットワークにおける自己参照的な重み行列です。これにより、重みを変更することが可能となります。この概念のよりスケーラブルなバージョンは、2022年に入江らによって提案されています。

3. オープンエンデッドとLLM: PROMPTBREEDERは、LLMが例から変動を生成し、新規性を定量化する能力を持っているという考えに基づいています。他のシステムとは異なり、Promptbreederはプロンプトの領域を自律的に探索します。「データから学習」から「どのデータから学習するかを学習する」への移行を意味します。

さらに深く掘り下げる

PROMPTBREEDERはLLMにおける自己参照的な自己改善と考えることができます。Promptbreederの作業プロセスは以下のように要約されます:

1. タスクプロンプトの変異: PROMPTBREEDERは、タスクプロンプトの集団から始まり、それらに変異を加えることでさまざまなバリアントを生成します。

2. フィットネス評価: これらの変更されたタスクプロンプトの適合性は、トレーニングデータセットを使用して評価されます。LLMがこれらのプロンプトに効果的に応答するかどうかを測定します。

3. 継続的な進化: この変異と評価のプロセスは、生物学的進化に類似していくつかの世代にわたって反復されます。

画像のクレジット:Google DeepMind

問題の説明に直面し、一連の一般的な「思考スタイル」と突然変異促進が備わった状態で、PROMPTBREEDERはダイナミックなプロセスを開始します。このプロセスにより、進化的な単位の集団が生まれます。これらの単位は通常、2つのタスクプロンプトと1つの突然変異プロンプトで構成されています。

プロンプトの進化を追求するために、PROMPTBREEDERは2011年にハービーによって開発された、確立されたバイナリトーナメント遺伝アルゴリズムフレームワークを採用しています。タスクプロンプトの優位性を測定するため、そのパフォーマンスはトレーニングデータのランダムな選択に対して検証されます。

PROMPTBREEDERは複数の世代にわたって変容の旅に出ます。タスクプロンプトと突然変異プロンプトに変異を導入し、5つの異なるクラスの突然変異演算子を利用します。この進化の旅は、特定のドメインにより適応性が高いタスクプロンプトの出現を促し、同時に突然変異プロンプトを自己言及プロセスを通じて徐々に洗練させます。

PROMPTBREEDERは変異プロンプトのシードセット、思考スタイル、特定のドメインの問題の説明を活用して、タスクプロンプトと突然変異プロンプトを生成します。LLMは突然変異演算子として利用されます。複数の世代にわたって、PBはプロンプトが特定のドメインに適応する様子を観察し、数学、常識的な推論、算術、倫理などのさまざまな領域での効果を示しています。

画像クレジット: Google DeepMind

一部の既存のプロンプト手法(Chain-of-Thoughtなど)とは異なり、PROMPTBREEDERは自己言及的な自己改善のためのパラメータの更新を必要としません。このアプローチは、より大きく能力の高いLLMがその利点をさらに増幅できる有望な未来を示唆しています。

PROMPTBREEDERの基盤は、LLMが入力テキストのバリエーションを生成できる能力に基づいています。タスクプロンプトは、LLMが後に入力を続ける際により良い応答をするために使用される文字列です。タスクプロンプトを評価するために、関連するドメインのトレーニングセットからのQ&Aペアのバッチがサンプリングされます。Promptbreederは進化アルゴリズムを採用し、突然変異演算子は突然変異プロンプトに応じて制約のあるLLMです。

PROMPTBREEDERの興味深い側面の一つは、自己言及メカニズムです。このメタレベルのアルゴリズムは、突然変異プロンプトを進化させるためにハイパーミューテーションプロンプトに基づくLLMを活用します。このプロセスは、突然変異したタスクプロンプトの集団を初期化することから始まります。各進化の単位には、タスクプロンプトのセット、突然変異プロンプト、そして場合によっては正しい作業のセットが含まれます。

まとめると、PROMPTBREEDERは自己言及的な自己改善を通じて大規模言語モデルの能力を向上させる有望なアプローチを提案しています。そのポテンシャルは、自律的にプロンプトを進化させ、特定のドメインに適応し、定数のパラメータ更新が必要なく、より効率的で能力の高いLLMへの道を提供するという点にあります」。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

この中国のAI研究は、マルチモーダルな大規模言語モデル(MLLMs)の幻覚を修正するために設計された革新的な人工知能フレームワークである「ウッドペッカー」を紹介します

中国の研究者たちは、マルチモーダルな大規模言語モデル(MLLM)における幻覚の問題に対処するために、Woodpeckerという新し...

AIニュース

「KPMG、AIに20億ドル以上の賭けをし、120億ドルの収益を目指す」

技術革新の急速なペースを強調する大胆な動きとして、主要なプロフェッショナルサービス企業であるKPMGは、生成型AIへの大幅...

AIニュース

「OpenAIはAIの安全性に対処するためにベンガルールで開発者ミートアップを計画中」

OpenAIは、AIチャットボットChatGPTの影響力のある力を持つ組織であり、2024年1月にベンガルールで開発者の集まりを開催する...

データサイエンス

「もし私たちが複雑過ぎるモデルを簡単に説明できるとしたらどうだろう?」

この記事は次の記事に基づいています:https//www.sciencedirect.com/science/article/abs/pii/S0377221723006598 これを読ん...

データサイエンス

特定のドメインに特化した物体検出モデルの最適化方法

物体検出は、学術界から産業分野まで、広範な領域で広く採用されていますその理由は、低い計算コストで素晴らしい結果を提供...