マイクロソフトとMITの研究者たちによる新しい方法、AIの幻覚を減らすことを目指して

Microsoft and MIT researchers aim to reduce AI hallucinations with a new approach.

NLPの領域では、大規模な言語モデルがテキストデータとのやり取りにおいて重要な役割を果たしてきました。しかし、いくつかの重大な進展があったにもかかわらず、「幻覚」という問題は依然として存在し続けています。幻覚とは、モデルが現実世界の事実と矛盾する情報を生成することです。

MITとマイクロソフトの研究者グループによる新しい論文によれば、新しいアプローチがAIの幻覚を減らすのに役立つかもしれません。AIの幻覚に関連する問題の一つは、これらの問題に関連する危険性です。

これは特に臨床や法律の産業を対象としたアプリケーションに関して懸念されます。これは、独自の規制やコンプライアンス基準により、AIの幻覚のリスクが特有の法的および責任の問題を引き起こす可能性があるためです。

ここでDoLaが登場します。DoLaの戦略は、モデルのより深い層からの情報を優先し、中間または浅い層からの情報を軽視するというものです。この対照的なデコーディングアプローチにより、外部の知識の取得やさらなる微調整の必要なく、LLMの事実知識が向上します。

これまでの実験結果は有望なもののようです。TruthfulQAやFACTORデータセット上のLLMAなどのLLMの完全性を向上させることが実証されています。さらに、StrategyQAやGSM8K ccにおける思考の連鎖推論に焦点を当てた実験は、その能力を大幅に向上させる可能性が示唆されています。

さらに興味深いことに、DoLaはGPT-4を用いたオープンエンドのテキスト生成の評価において、情報量が豊富でかつ事実に基づいた応答を生成し、従来のデコーディング方法と比較して優れた評価を受けました。さらに、デコーディングプロセスにはわずかな時間しか追加されないため、実用的で効率的な解決策となります。

研究は有望に見えますが、論文では、チームが指示に従ったり人間のフィードバックに応答したりするなど、他の領域へのテストを拡張しなかったことを指摘しています。また、彼らのアプローチは既存のアーキテクチャとパラメータに完全に依存しているため、可能な改良の範囲が制限されています。

回復補強型LLMとは異なり、DoLaは既存のモデルの知識に完全に依存し、外部の情報取得モジュールを介して新しい情報を追加しません。研究者は、将来の研究でこれらのコンポーネントを統合し、これらの制限を克服する可能性があると希望を表明しています。

興味があれば、DoLaのGitHubはこちらで見つけることができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

Discover more

機械学習

PyTorchを使用して畳み込みニューラルネットワークを構築する

このブログ投稿では、PyTorchを使用して画像分類のための畳み込みニューラルネットワークを構築するチュートリアルを提供して...

機械学習

「Azure Lightweight Generative AI Landing Zone」

「Azure AI サービスに基づくランディングゾーンの構築に関する完全ガイドでは、AI プロダクトを紹介し、AI の活用により利益...

機械学習

TensorRT-LLMとは、NVIDIA Tensor Core GPU上の最新のLLMにおいて推論パフォーマンスを高速化し最適化するためのオープンソースライブラリです

人工知能(AI)の大規模言語モデル(LLM)は、テキストを生成したり、言語を翻訳したり、さまざまな形式の創造的な素材を書い...

データサイエンス

なぜデータは「新しい石油」ではなく、データマーケットプレイスは私たちに失敗したのか

「データは新しい石油」というフレーズは、クライブ・ハムビーによって2006年に造られ、それ以来広く引用されてきましたしか...

AI研究

アムステルダム大学とクアルコムAIの研究者がVeRAを発表:LoRAと比べて訓練可能なパラメーターの数を10倍削減する革新的なファインチューニングAI手法

自然言語処理の応用範囲の拡大に伴い、最小限の計算複雑性とメモリ要件で特定の指示を効果的に理解し行動するモデルへの需要...

AI研究

「UCバークレーの研究者が開発したALIA:微細分類タスクのための自動言語ガイド画像拡張の画期的なブレイクスルー」

細粒度イメージ分類は、大きなカテゴリ内のサブカテゴリに画像を分類するコンピュータビジョンのタスクです。これは、特定の...