「リトリーバルの充実は長文の質問応答にどのように影響を与えるのか? このAIの研究は、リトリーバルの充実が言語モデルの長文での知識豊かなテキスト生成にどのような影響をもたらすかについて新しい示唆を提供します」

AI研究:リトリーバルの充実が言語モデルの長文での知識豊かなテキスト生成に与える影響に新たな示唆

LFQAは、どんな質問にも完全かつ詳細な回答を提供することを目指しています。大規模言語モデル(LLM)と推論時に提示される検索された文書内のパラメータ情報により、LFQAシステムは証拠文書のスパンを抽出するのではなく、パラグラフ形式で複雑な回答を構築することが可能です。近年の研究では、大規模LLMのLFQA能力の驚異的な優れた点と脆弱性が明らかになっています。最新の適切な情報を提供するために、検索が強力なアプローチとして提案されてきました。しかし、検索による拡張が製品の過程でLLMにどのような影響を与えるのかはまだ分かっておらず、常に予想どおりの効果があるわけではありません。

テキサス大学オースティン校の研究者は、検索がLFQAの回答生成にどのように影響を与えるかを調査しました。彼らの研究では、LMが一定のままで証拠文書が変化する場合とその逆の場合の2つのシミュレートされた研究コンテキストを提供しています。LFQAの品質を評価するのは困難なため、研究者は一貫性などの異なる回答属性に関連する表面的な指標(長さ、Perplexityなど)を数えることから始めました。検索拡張されたLFQAシステムの中で生成された回答を証拠文書に帰属させる能力は魅力的な特徴です。新たに取得した文レベルの帰属データを使用して、市販の帰属検出技術をテストしました。

表面的なパターンの検査から、チームは検索拡張がLMの生成を大きく変更することを結論づけました。提出される論文が関係ない場合でも、すべての影響が緩和されるわけではありません。例えば、生成された回答の長さは変わる場合があります。関連性のない文書とは異なり、文脈内の重要な証拠を提供する文書は、LMが予期しないフレーズをより多く生成する原因となります。同じ証拠文書のセットを使用していても、さまざまな基盤となるLMは検索拡張から対照的な影響を受けることがあります。彼らの新たに注釈付けされたデータセットは、帰属評価を測定するための基準として使用されます。研究結果は、事実ベースのQAでは帰属を特定したNLIモデルがLFQAの文脈でも優れたパフォーマンスを示し、正解率では人間の合意から15%離れているものの、偶然のレベルをはるかに上回ることを示しています。

この研究は、同じ文書のセットが与えられても、帰属の品質が基盤となるLM間で大きく異なる可能性があることを示しています。研究はまた、長文生成のための帰属パターンにも光を当てました。生成されたテキストは、文脈内の証拠文書の順序に従う傾向があります。文脈文書が複数の論文の連結である場合でも、最後の文は前の文よりも追跡が難しいです。全体として、この研究はLMが文脈証拠文書を活用して詳細な質問に答える方法を明らかにし、実践的な研究のアジェンダに向けて示唆を与えています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

このAI論文は、実世界の網膜OCTスキャンを使用して、年齢に関連した黄斑変性の段階を分類するためのディープラーニングモデルを紹介しています

新しい研究論文では、網膜光干渉断層法(OCT)スキャンを使用した老年性黄斑変性(AMD)の段階に基づいたディープラーニング...

機械学習

アップステージがSolar-10.7Bを発表:一回の会話用に深いアップスケーリングと微調整された精度を持つ先駆的な大規模言語モデルを実現

韓国のAI企業、Upstageの研究者たちは、言語モデルのパフォーマンスを最大化し、パラメータを最小化するという課題に取り組ん...

AIニュース

「ジェミニに会おう:チャットGPTに対するGoogleの答え」

人工知能の進化する世界において、Googleは最新作のGemini AIにより画期的な飛躍を遂げました。Googleによると、異なるサイズ...

機械学習

「トランスフォーマーの簡素化:理解できる単語を使った最先端の自然言語処理(NLP)-パート2- 入力」

ドラゴンは卵から孵り、赤ちゃんはおなかから飛び出し、AIに生成されたテキストは入力から始まります私たちはみんなどこかか...

データサイエンス

「EU AI Actについて今日関心を持つべき理由」

「MLおよびAI業界で働く私たちのほとんどは、新しい規制に関する見出しを見て流し読みするでしょう新しい規制は『法律用語』...

機械学習

AIによる生産性向上 生成AIが様々な産業において効率の新たな時代を開く

2022年11月22日、ほとんど仮想的な瞬間が訪れ、それは地球上のほぼすべての産業の基盤を揺るがしました。 その日、OpenAIは史...