『ゴーストバスター内部:バークレー大学のAI生成コンテンツ検出の新しい方法』

「ゴーストバスターの内幕:バークレー大学によるAI生成コンテンツの検出法の最新情報」

新しい手法は、ドキュメント内のAIによって生成されたトークンの可能性を検出するために確率分布法を使用します。

Created Using DALL-E

私は最近、すでに16万人以上の購読者を持つAIに特化した教育ニュースレターを開始しました。TheSequenceは、ハイプやニュースなどのないMLに焦点を当てたニュースレターで、5分で読むことができます。目標は、機械学習のプロジェクト、研究論文、概念について最新の情報を提供することです。以下の購読を試してみてください:

TheSequence | Jesus Rodriguez | Substack

機械学習、人工知能、データの最新の動向を把握するための最高の情報源…

thesequence.substack.com

大規模言語モデル(LLM)の急速な進化により、人間とAIによるコンテンツの区別が困難になりました。最近、この課題に取り組むさまざまな解決策が出てきましたが、誤検知の数は非常に懸念されます。最近、バークレイAI研究(BAIR)はAIによるコンテンツを特定するための新しい技術を紹介する論文を発表しました

最近の研究論文で発表されたGhostbusterは、AIによって生成されたテキストの特定において強力な解決策として登場します。その運用フレームワークは、さまざまな弱い言語モデルの監視下でドキュメント内の各トークンの生成確率を綿密に計算することに基づいています。その後、Ghostbusterはこれらのトークンの確率から得られる関数の融合を使用して、確定的な分類器の入力として機能します。

Ghostbusterの注目すべき特徴の一つは、モデルに依存しない性質です。Ghostbusterは、ドキュメント生成の具体的なモデルやそのモデルの出力に関連する確率についての事前知識なしで動作します。この固有の品質により、GhostbusterはChatGPTやClaudeなどの一般的な商業モデルでよく見られる、確率が開示されていない不明なまたはブラックボックスモデルによって生成されたテキストを検出するためのユニークなユーティリティを備えています。

Image Credit: BAIR

Ghostbusterの内部構造

Ghostbusterの内部構造は、緻密に設計された3つの段階のトレーニングプロセスによって展開されます。各段階は、AIによって生成されたテキストを効果的に識別するためのシステムの能力に寄与します。

  1. 確率の計算: 初期段階では、各ドキュメントをベクトルの系列に変換します。この変換は、ドキュメント内で個々の単語を生成する確率を評価することによって達成されます。Ghostbusterは、ユニグラムモデル、トリグラムモデル、および二つの非指示型GPT-3モデル(adaとdavinci)を含む一連の弱い言語モデルによってこれを実現します。
  2. 特徴の選択: 第二段階は、構造化された特徴選択手法に基づいています。これは、前の段階で計算された確率を組み合わせるための一連のベクトルとスカラー演算のセットを確立することによって動作します。この手法は、前向き特徴選択を通じてこれらの演算のさまざまな組み合わせをシステマティックに探索し、最も有益な特徴を絶えず組み込みます。
  3. 分類器のトレーニング: 最終段階は、確率に基づく最も有望な特徴に基づいて線形分類器のトレーニングを行います。この分類器は、特徴選択プロセス中に特定されたものを使用して構築されます。さらに、パフォーマンスを向上させるために、特定の手動で選択された特徴をモデルに統合します。

実際には、Ghostbusterは対応する人間が作成したドキュメントとAIによって生成されたドキュメントを、一連の弱い言語モデルに提出することで解析を開始します。これらのモデルは、基本的なユニグラムモデルからより高度な非指示型GPT-3モデルであるdavinciまでの範囲をカバーしています。Ghostbusterは、これらのモデルによって生じる単語の確率を利用して、ベクトルとスカラー関数の多次元空間を探索します。この探索は、これらの確率を簡潔な特徴のセットに合成することを目的としています。

ゴーストバスタープロセスの最終ステップでは、これらの抽出された特徴を線形分類器に入力します。これについては、手法のセクション4で詳しく説明されています。その結果、このモデルはドメイン内分類で恒常的に印象的なF1スコア99.0を達成します。特に、ゴーストバスターはDetectGPTとGPTZeroの両方を平均23.7 F1の差で上回り、様々な文脈やシナリオでAIによって生成されたテキストを識別する効果的な手法であることを強調しています。

画像のクレジット: BAIR

結果

ゴーストバスターの堅牢な一般化への取り組みは、その設計の中核的な側面です。さまざまなテキスト生成シナリオでの効果を確保するために、ゴーストバスターは包括的な評価を受けました。この評価には、エッセイ、ニュース記事、ストーリーなどを含む新たに収集されたデータセットを組み込むことで実施されました。

同じドメインで訓練およびテストされた場合、ゴーストバスターは3つのデータセット全体で99.0 F1を達成し、GPTZeroを5.9 F1の差で上回り、DetectGPTを41.6 F1の差で上回りました。ドメイン外では、ゴーストバスターはすべての条件で平均97.0 F1を達成し、DetectGPTを39.6 F1の差で上回り、GPTZeroを7.5 F1の差で上回りました。RoBERTaのベースラインは、全データセットでのドメイン内評価では98.1 F1を達成しましたが、一貫した一般化性能はありませんでした。ゴーストバスターは、創作執筆を除くすべてのドメインでRoBERTaベースラインを上回り、平均的にはRoBERTaよりも優れたドメイン外パフォーマンス(13.8 F1の差)を示しました。

画像のクレジット: BAIR

ゴーストバスターはAIによって生成されたコンテンツの検出のために作成された最もクリエイティブな方法の1つです。この手法はLLMのさまざまなタイプに適用可能なように思えます。ゴーストバスターが異なる検出ツールに適用された実装を見ることを望みます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました

単一モダリティのプロファイリング(RNA、タンパク質、オープンクロマチン)から多モダリティのプロファイリングや空間的トラ...

機械学習

このAI論文では、リーマン幾何学を通じて拡散モデルの潜在空間の理解に深入りします

人工知能や機械学習の人気が高まる中で、自然言語処理や自然言語生成などの主要なサブフィールドも高速に進化しています。最...

AI研究

腫瘍の起源の解読:MITとDana-Farber研究者が機械学習を活用して遺伝子配列を分析する方法

MITとDana-Farber Cancer Instituteの画期的な共同研究により、機械学習の力ががん治療における困難な課題に取り組むために活...

AIニュース

「OpenAIがGPT-6およびGPT-7の立ち上げ準備を進める:中国で商標申請」

人工知能(AI)の推進に対するコミットメントを示す戦略的な動きとして、OpenAIは最近、中国でGPT-6とGPT-7の商標を申請しま...

データサイエンス

埋め込みとベクトルデータベース 実践的なガイド!

生成AIは急速に進化し、テクノロジーやデータ管理の景観を根本的に変えているベクターデータベースの世界へようこそ

機械学習

Google Gemini APIを使用してLLMモデルを構築する

導入 ChatGPTとOpenAIのGPTモデルのリリース、およびMicrosoftとのパートナーシップにより、AIの領域にTransformerモデルをも...