ヴェクタラは、AI言語モデルの「幻覚」をベンチマーク化し、対処するための画期的なオープンソースモデルを立ち上げます

AI言語モデルの「幻覚」対処の画期的なオープンソースモデル『ヴェクタラ』発表

急速に進化するGenerative AI(GenAI)領域での責任追及を促進する前例のない取り組みとして、Vectaraはオープンソースの幻覚評価モデルを公開しました。これは、Large Language Models(LLMs)の事実に基づく正確性の測定を標準化するための重要な一歩であり、LLMsによる真実からの逸脱である「幻覚」の度合いを測定するための商業およびオープンソースのリソースを提供します。

この公開は、透明性を強化し、主要なGenAIツールの幻視リスクを定量化する客観的な手法を提供することを目的としており、責任あるAIの促進、誤情報の緩和、効果的な規制の基盤を築くための重要な措置です。幻視評価モデルは、提供された参考資料に基づくコンテンツの生成時にLLMsがどれだけ事実に基づいているかを評価するうえで、重要なツールとなるでしょう。

Vectaraの幻覚評価モデルは、Apache 2.0ライセンスに基づいてHugging Face上でアクセス可能であり、LLMsの事実的な完全性を明確に示しています。これ以前は、LLMベンダーがモデルの幻覚耐性に関する主張を検証する手段がほとんどありませんでした。Vectaraのモデルは、最新の幻覚研究の進歩を活用して、客観的にLLMの要約を評価します。

公開には、Vectaraのチームがオープンソースコミュニティと協力して維持しているLeaderboard(GenAIの正確さに対するFICOスコアに似たもの)が付属しています。これにより、LLMsは標準化された一連のプロンプトでのパフォーマンスに基づいてランク付けされ、ビジネスと開発者にとって有益な情報を提供します。

Leaderboardの結果からは、OpenAIのモデルが現在のパフォーマンスでリードし、Llama 2モデルが続いており、CohereとAnthropicも力強い結果を示しています。しかし、GoogleのPalmモデルのスコアは低くなっており、領域の持続的な進化と競争を反映しています。

Vectaraのモデルは幻覚への解決策ではありませんが、より安全かつ正確なGenAIの導入のための決定的なツールです。その導入は、米国大統領選挙などの重大なイベントに向けて、誤情報のリスクに関する関心が高まる時期に行われました。

幻覚評価モデルとLeaderboardは、業界および規制当局の待望の標準的な基準を提供することで、GenAIの規制にデータ駆動のアプローチを促進するうえで重要な役割を果たすことが期待されます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

効率的な開発者ですか?それならAIがあなたの仕事を狙っています

開発における人間とAIの利点は、効果と効率の一致によるものです前者は曖昧で主観的ですが、後者は議論の余地がなくデータに...

データサイエンス

「オープンソースLLMの完全ガイド」

この包括的なガイドを使って、オープンソースの大規模言語モデル(LLM)の世界を開放し、プロジェクトで共同AIの力を活用して...

AIニュース

「ジェネレーティブAIによる先進的なトランスフォーマーで創造性を解き放つ」

導入 人工知能の絶え間なく進化する風景において、近年際立った存在となっている名前があります。それがトランスフォーマーと...

人工知能

I/O 2023 で発表した100のこと

Google I/O 2023はニュースとローンチで満ち溢れていましたここではI/Oで発表された100のことを紹介します

AI研究

CMUとプリンストンの研究者がマンバを発表:多様なモードのディープラーニングアプリケーションにおいてトランスフォーマーの効率を超えるSSMアーキテクチャの画期的な進展

現代の機械学習において、ファウンデーションモデルは、大量のデータで事前に学習され、その後に下流のタスクに対して改変さ...

データサイエンス

「JAXにおけるディープ強化学習の優しい入門」

最近の強化学習(RL)の進歩、例えばWaymoの自律タクシーやDeepMindの人間を超えたチェスプレイヤーエージェントなどは、ニュ...