Google AIは、「ペアワイズランキングプロンプティング」という新しい方法を提案し、LLMsの負担を軽減することを目指しています

Google AI proposes a new method called pairwise ranking prompting to alleviate the burden of LLMs.

Google AIの研究者は、新しいアプローチである「ペアワイズランキングプロンプティング(PRP)」を提案する新しい論文を公開しました。この目標は、大規模な言語モデルがテキストのランキング問題を解決する際に直面する課題を軽減することです。GPT-3やPaLMなどのLLMは、自然言語のタスクで卓越したパフォーマンスを示しており、ゼロショット設定でも優れた結果を出しています。

しかし、テキストのランキングに関しては、既存の手法はトレーニングされたベースラインのランカーに比べて不十分な結果を残す傾向があります(GPT-4などのブラックボックスシステムを除く)。論文では、チームはブラックボックスシステムの価値を認めつつも、コストやアクセスの制約など、学術研究者が直面する制約にも言及しています。

そのため、彼らの研究では、現在のポイントワイズとリストワイズのアプローチを使用したLLMがランキング問題で苦戦する理由について探求しています。チームによると、彼らはLLMにとって、ポイントワイズのテクニックに対してキャリブレーションされた予測確率を生成することが極めて困難であることを発見しました。

一方、リストワイズのテクニックは一貫性のない結果や関連性のない出力をもたらし、現在のLLMの事前学習と微調整技術におけるランキングの意識の不足を示しています。そのため、この制約を補うために、研究者たちはPRPパラダイムを提案しました。

この方法は、ランキングタスクのプロンプトとしてクエリと2つのドキュメントを使用するシンプルなプロンプトアーキテクチャを活用しています。既存の手法とは異なり、PRPはデフォルトで生成とスコアリングのLLM APIの両方を提供し、キャリブレーションの問題に対処しています。効率と効果を確保するために、いくつかのPRPのバリエーションが議論されています。

彼らは、伝統的なベンチマークデータセットにおいて、中程度のサイズのオープンソースLLMを使用してPRPを評価しました。その結果、大規模なモデルサイズを持つブラックボックスの商用GPT-4に基づく従来の手法を大幅に上回る成果を収めました。

その一例がTREC-DL2020データセットです。20BパラメータのFLAN-UL2モデルに基づくPRPは、従来の最良の手法と比べてNDCG@1で5%以上の改善を達成しました。TREC-DL2019では、PRPはInstructGPTなどの既存のソリューションを多くのランキング指標で10%以上上回り、NDCG@5とNDCG@10のメトリックにおいてはGPT-4と比較してわずかなパフォーマンスの低下がありました。

全体として、PRPにはLLMのスコアリングと生成のためのAPIのサポート、および入力順序に対する無感覚性といういくつかの利点があります。この研究は3つの主要な貢献を示しています。まず、中程度のサイズのオープンソースLLMを使用した効果的なゼロショットランキングの実証です。次に、シンプルなプロンプティングとスコアリングメカニズムによる最先端のランキングパフォーマンスの達成です。

そして最後に、良好な経験的なパフォーマンスを維持しながら効率性の向上を探求します。

編集者の注:最新の生成AIについて学びたいですか?1日限りのジェネレーティブAIサミットに参加しましょう。ハイプを超えて、この最先端のテクノロジーに深く没頭しましょう。無料で今すぐ登録して、ジェネレーティブAIのパワーを解き放ってください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

ピンクのローバーが赤い惑星に取り組む、科学における女性の障壁

オーストラリアのチームは、ピンク色のロボットローバーを使用して、ユタ州ハンクスビルで開催されたUniversity Rover Challe...

AIニュース

新しいAIモデル、たった30BパラメーターでGPT-3を凌駕する

世界的に有名なオープンソース言語モデル(LLMs)プロバイダーであるMosaicMLは、最新世代のNVIDIA H100アクセラレータを搭載...

機械学習

量子コンピュータを使ってより高度な機械学習モデル

研究者は、クラシカルコンピュータと量子コンピュータの最も優れた機能を組み合わせた手法を用いて、機械学習モデルの訓練を...

AIニュース

昆虫サイボーグ:精密な動きに向けて

研究者たちは、スティック昆虫の脚の筋肉における電気刺激が、ハイブリッド昆虫コンピュータロボットの精密なモーターコント...

AIニュース

「400ポンドのNYPDロボットがタイムズスクエアの地下鉄駅で試用される」

ニューヨーク市警察は、タイムズスクエアの地下鉄駅で約400ポンドの「完全に自律型の屋外セキュリティロボット」を試験導入し...

機械学習

AgentBenchをご紹介します:さまざまな状況で大規模な言語モデルをエージェントとして評価するために開発された多次元ベンチマークです

大規模言語モデル(LLM)は登場し、進化し、人工知能の分野に複雑さの新たなレベルを加えました。徹底的なトレーニング方法に...