マイクロソフトとMITの研究者たちによる新しい方法、AIの幻覚を減らすことを目指して

Microsoft and MIT researchers aim to reduce AI hallucinations with a new approach.

NLPの領域では、大規模な言語モデルがテキストデータとのやり取りにおいて重要な役割を果たしてきました。しかし、いくつかの重大な進展があったにもかかわらず、「幻覚」という問題は依然として存在し続けています。幻覚とは、モデルが現実世界の事実と矛盾する情報を生成することです。

MITとマイクロソフトの研究者グループによる新しい論文によれば、新しいアプローチがAIの幻覚を減らすのに役立つかもしれません。AIの幻覚に関連する問題の一つは、これらの問題に関連する危険性です。

これは特に臨床や法律の産業を対象としたアプリケーションに関して懸念されます。これは、独自の規制やコンプライアンス基準により、AIの幻覚のリスクが特有の法的および責任の問題を引き起こす可能性があるためです。

ここでDoLaが登場します。DoLaの戦略は、モデルのより深い層からの情報を優先し、中間または浅い層からの情報を軽視するというものです。この対照的なデコーディングアプローチにより、外部の知識の取得やさらなる微調整の必要なく、LLMの事実知識が向上します。

これまでの実験結果は有望なもののようです。TruthfulQAやFACTORデータセット上のLLMAなどのLLMの完全性を向上させることが実証されています。さらに、StrategyQAやGSM8K ccにおける思考の連鎖推論に焦点を当てた実験は、その能力を大幅に向上させる可能性が示唆されています。

さらに興味深いことに、DoLaはGPT-4を用いたオープンエンドのテキスト生成の評価において、情報量が豊富でかつ事実に基づいた応答を生成し、従来のデコーディング方法と比較して優れた評価を受けました。さらに、デコーディングプロセスにはわずかな時間しか追加されないため、実用的で効率的な解決策となります。

研究は有望に見えますが、論文では、チームが指示に従ったり人間のフィードバックに応答したりするなど、他の領域へのテストを拡張しなかったことを指摘しています。また、彼らのアプローチは既存のアーキテクチャとパラメータに完全に依存しているため、可能な改良の範囲が制限されています。

回復補強型LLMとは異なり、DoLaは既存のモデルの知識に完全に依存し、外部の情報取得モジュールを介して新しい情報を追加しません。研究者は、将来の研究でこれらのコンポーネントを統合し、これらの制限を克服する可能性があると希望を表明しています。

興味があれば、DoLaのGitHubはこちらで見つけることができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

Discover more

人工知能

「KaggleのAIレポート2023で未来にダイブしよう - ホットなトレンドをチェックしよう」

「AIの世界について学んだことについて、世界最大のデータサイエンスと機械学習コミュニティに飛び込んでください」

AI研究

DeepMindの研究者たちは、任意のポイントを追跡するための新しいAIモデルであるTAPIRをオープンソース化しましたこのモデルは、ビデオシーケンス内のクエリポイントを効果的に追跡します

コンピュータビジョンは、人工知能の最も人気のある分野の1つです。コンピュータビジョンを使用したモデルは、デジタル画像、...

機械学習

「Amazon SageMaker JumpStartで大規模な言語モデルの応答をストリーム配信する」

「Amazon SageMaker JumpStartでは、言語モデル(LLM)の推論応答をストリーミングで提供できるようになりましたトークンのス...

機械学習

「Amazon PharmacyはAmazon SageMakerを使用して、LLMベースのチャットボットを作成する方法を学びましょう」

「Amazon PharmacyはAmazon.com上のフルサービス薬局であり、透明な価格設定、臨床とカスタマーサポート、そしてドアへの無料...

AIニュース

創造力を解き放つ:ジェネレーティブAIとAmazon SageMakerがビジネスを支援し、AWSを活用したマーケティングキャンペーンの広告クリエイティブを生み出します

広告代理店は、生成AIとテキストから画像を生成する基礎モデルを使用して、革新的な広告クリエイティブとコンテンツを作成す...

AIニュース

「2023年のトップ40の生成AIツール」

ChatGPT – GPT-4 GPT-4はOpenAIの最新のLLMであり、以前のモデルよりもより創造的で正確で安全です。また、画像、PDF、CSVな...