「SynthIDを使ったAI生成画像の識別」
AI-generated image identification using SynthID
新しいツールが、Imagenが作成した合成画像に透かしを入れることや識別を支援します
AIによる生成画像は、日々より人気が高まっています。しかし、特にそれらが非常にリアルに見える場合、それらをより良く識別する方法はありますか?
今日、Google Cloudとのパートナーシップにより、SynthIDのベータ版をリリースします。SynthIDは、AIによって生成された画像に透かしを埋め込み、識別可能にするツールです。この技術は、画像のピクセルにデジタル透かしを直接埋め込むことで、人間の目には感知できないが、識別可能になります。SynthIDは、Imagenを使用する私たちの最新のテキストから画像を生成するモデルの一部であるVertex AIの一部の顧客に限定して提供されます。
生成AI技術は急速に進化しており、AIシステムによって生成されていないものと区別することがますます困難になっています。
生成AIは非常に大きな創造的な可能性を開放できますが、意図的または意図せずに作成者が誤った情報を広めるという新たなリスクももたらします。AIによって生成されたコンテンツを識別できることは、人々に生成メディアとやり取りしているときの知識を与え、誤情報の拡散を防ぐために重要です。
- UCLとGoogleの研究者が提案する「AudioSlots:オーディオドメインの盲目的なソース分離のためのスロット中心の生成モデル」
- 初心者のための2023年の機械学習論文の読み方
- ワシントン大学とAI2の研究者が、VQAを介してAIが生成した画像の忠実度を測定する自動評価指標であるTIFAを紹介します
私たちは、人々を高品質な情報とつなげ、クリエイターとユーザーの信頼を社会全体で維持することに取り組んでいます。その一環として、AIによって生成された画像を識別するためのより高度なツールをユーザーに提供し、彼らの画像(編集されたバージョンも含めて)が後日識別できるようにする責任を果たしています。
Google Cloudは、責任を持ってAIによって生成された画像を作成し、確実に識別するためのツールを提供する最初のクラウドプロバイダーです。この技術は、責任あるAIの開発と展開に基づいており、Google DeepMindによって開発され、Google Researchとのパートナーシップで改良されました。
SynthIDは、極端な画像操作に対して完全に確実ではありませんが、AIによって生成されたコンテンツを責任を持って取り扱うための有望な技術的アプローチを提供します。このツールは、画像以外の音声、ビデオ、テキストなどの他のAIモデルやモダリティとともに進化する可能性もあります。
AI画像の新しいタイプの透かし
透かしは、画像に重ねることでそれらを識別するためのデザインです。紙に物理的な刻印から、デジタル写真に見られる透明なテキストやシンボルまで、歴史を通じて進化してきました。
AIによって生成された画像を識別するためには、従来の透かしは十分ではありません。なぜなら、それらは画像のスタンプのように適用され、簡単に編集されることができるからです。たとえば、画像の角にある離散的な透かしは、基本的な編集技術で切り取ることができます。
目に見える透かしと不正確性とのバランスを見つけることは困難です。画像の上部に名前やロゴを持つレイヤーとして追加される高く目立つ透かしは、クリエイティブまたは商業目的においても美的な課題を提起します。同様に、以前に開発された目に見えない透かしは、リサイズなどの簡単な編集技術によって失われることがあります。
SynthIDは画像の品質を損なうことなく、透かしを検出可能なままにするように設計されており、フィルターの追加、色の変更、さまざまな損失圧縮スキーム(主にJPEGで使用される)で保存しても検出可能です。
SynthIDは、透かしを埋め込むモデルと識別するモデルの2つのディープラーニングモデルを使用しています。これらは、多様な画像のセットで共にトレーニングされたものです。組み合わせたモデルは、透かしの内容を正しく識別し、視覚的に透かしをオリジナルのコンテンツに合わせることなど、さまざまな目的に最適化されています。
堅牢かつスケーラブルなアプローチ
SynthIDは、Vertex AIのお客様が責任を持ってAI生成画像を作成し、自信を持ってそれらを識別することを可能にします。この技術は完璧ではありませんが、内部テストでは一般的な画像操作に対して正確であることが示されています。
SynthIDの組み合わせアプローチ:
- ウォーターマーキング:SynthIDはImagenによって生成された合成画像に目に見えないウォーターマークを追加することができます。
- 識別:画像をデジタルウォーターマークでスキャンすることで、SynthIDはその画像がImagenによって作成された可能性を評価することができます。
このツールは、ウォーターマークの識別結果を解釈するための3つの信頼レベルを提供します。デジタルウォーターマークが検出された場合、画像の一部はImagenによって生成された可能性が高いです。
SynthIDは、デジタルコンテンツの識別に向けた広範なアプローチの一環として貢献しています。コンテンツを識別する最も一般的な方法の1つは、作成者や作成日時などの情報を提供するメタデータです。この情報は画像ファイルと共に保存されます。メタデータに追加されたデジタル署名によって、画像が変更されたかどうかが表示されます。
メタデータ情報が正常であれば、ユーザーは簡単に画像を識別することができます。ただし、メタデータは手動で削除されることもあり、ファイルが編集された際には失われることもあります。SynthIDのウォーターマークは画像のピクセルに埋め込まれているため、メタデータに基づく他の画像識別手法と互換性があり、メタデータが失われても検出可能です。
次は何ですか?
AI生成コンテンツを責任を持って構築するために、私たちは画像生成と識別、メディアリテラシーと情報セキュリティの各段階で安全で信頼性のあるアプローチの開発に取り組んでいます。
これらのアプローチは、生成モデルが進化し他のVoAGIに拡大するにつれて、頑健で適応可能である必要があります。私たちのSynthIDテクノロジーが社会全体のクリエイターやユーザーに向けたさまざまなソリューションと協力できることを願っており、ユーザーからのフィードバックを集め、機能を向上させ、新機能を探索することでSynthIDを進化させ続けています。
SynthIDは他のAIモデルにも拡大して利用できる可能性があり、私たちはそれをさらにGoogle製品に統合し、近い将来第三者に提供することに興奮しています。これにより、人々と組織が責任を持ってAI生成コンテンツを活用できます。
注意:このブログで合成画像を生成するために使用されるモデルは、ImagenとVertex AIで使用されるモデルとは異なる場合があります。
SynthIDについて詳しくはこちら:https://www.deepmind.com/synthid
Google Cloudの発表を読む:https://cloud.google.com/blog/products/ai-machine-learning/vertex-ai-next-2023-announcements
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Google Researchにおける責任あるAI:パーセプションの公平性
- Googleの研究者たちは、RO-ViTを紹介しますこれは、オープンボキャブラリー検出の改善のため、リージョンに意識を向けた方法でビジョントランスフォーマーを事前トレーニングするためのシンプルなAI手法です
- 「Google DeepMindの研究者が、チェスの課題に取り組むためのAIの多様性の力を明らかにする:計算問題解決における次の飛躍、AZ_dbの紹介」
- ウィスコンシン大学マディソン校の研究者たちは、「エベントフルトランスフォーマー:最小限の精度損失でコスト効果のあるビデオ認識手法」というタイトルで、イベントフルトランスフォーマーに基づくビデオ認識の費用対効果の高い手法を提案しています
- 「LLMはナレッジグラフを取って代わるのか? メタリサーチャーが提案する『ヘッド・トゥ・テイル』:大規模言語モデルの事実知識を測るための新たな基準」
- アリババの研究者は、Qwen-VLシリーズを紹介しますこれは、テキストと画像の両方を認識し理解するために設計された大規模なビジョン・ランゲージ・モデルのセットです
- 研究者たちは、ロボットが手全体を使って複雑な計画を立てることができるようにするAIを開発しました