「DeepMind AIが数百万の動画のために自動生成された説明を作成することで、YouTube Shortsの露出を大幅に向上させる」

DeepMind AIがYouTube Shortsの露出を大幅に向上させるために、数百万の動画の自動生成説明を作成する

DeepMindは、YouTubeとの共同作業で、YouTube Shortsビデオの検索性を向上させるために設計された最先端のAIモデル「Flamingo」を発表しました。これらの短い動画クリップは、人気のあるプラットフォームTikTokに似ており、より具体的な内容を見つけやすくするために、より説明的なテキストと意味のあるタイトルが必要です。しかし、Flamingoの導入により、ユーザーはこれらの動画をより簡単に発見する方法を持つようになりました。

Flamingoは、YouTube Shortsビデオの初期フレームを分析して説明的なテキストを生成するために、高度なビジュアル言語モデルを使用しています。たとえば、「猫が羊毛のボールで遊んでいる」というように、シーンを説明することができます。この生成されたテキストはメタデータとして保存され、効率的なビデオ分類と検索エンジンのアクセシビリティの向上を可能にします。

Flamingoの影響はすでに見られており、数十万件の新しくアップロードされたShortsビデオがAIによる説明を受けています。YouTubeは徐々にこの技術をすべてのShortsビデオに導入する予定であり、世界中の視聴者にとって見つけやすくすることを目指しています。

Flamingoは、DeepMindとYouTubeの最新の共同作業であり、Googleが4月に発表したDeepMindとGoogle Brainの統合AIビジネスグループへの融合をさらに固めています。彼らの以前の共同事業には、DeepMindのAIモデルMuZeroを利用して、YouTubeのVP9コーデックの圧縮伝送を向上させるものがあります。さらに、DeepMindとYouTubeは2018年に、広告とYouTubeのポリシーを一致させることによって収益を最大化する方法をビデオクリエーターに教育するために協力しました。このパートナーシップにより、ラベル品質モデル(LQM)の開発が行われ、精度の向上した広告の正確なコンテンツラベリングが保証され、プラットフォーム上の視聴者、クリエーター、広告主の信頼を築きました。

フルーツフルな共同作業を続けるDeepMindとYouTubeは、ビデオチャプターの導入によりユーザーエクスペリエンスを向上させるために取り組んできました。この開発により、ビデオとオーディオのコンテンツの転写を自律的に処理し、チャプターのセグメンテーションとタイトルの提案を行うAIシステムが作成されました。この革新的な機能であるAutoChaptersは、Google I/O 2022でCEOのSundar Pichaiによって発表されました。AutoChaptersにより、ユーザーは手間のかかる長いビデオを検索する必要がなくなり、AIシステムが迅速に重要なセクションを特定します。この機能はすでに800万件のビデオで使用されており、DeepMindは今後1年間で8000万件のビデオにその実装を拡大する予定です。

Flamingoに関して、YouTube Shorts制作チームは、AIモデルによって生成されるメタデータはクリエーターには表示されないことを明確にしています。主な焦点は、検索の正確性を大幅に向上させることです。また、Googleは、Flamingoによって生成されるテキストが厳格な責任基準に準拠しており、ビデオコンテンツのネガティブな表現を避けていることを保証しています。

YouTube Shortsビデオの検索性を革新するFlamingoが始動するにあたり、そのAIラベリングの精度は厳密に監視されるでしょう。AI技術の進化する時代において、FlamingoはDeepMindとYouTubeの共同作業の証です。彼らの共同の努力により、彼らはAIイノベーションの境界を再定義し、クリエーターと視聴者の両方にとってより魅力的でアクセスしやすい環境を育んでいます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Pythonクライアントを使用してMyScaleを始める」

「マイスケールの基本から、テーブルの作成やインデックスの定義などを学び、上級のSQLベクトル検索までを探求してくださいな...

人工知能

「AIガバナンスにおけるステークホルダー分析の包括的ガイド(パート2)」

「著者注:本記事はAIガバナンスにおけるステークホルダー分析の包括的なガイドのパート2として書かれていますパート1はこち...

AIニュース

Windows 12はAIの魔法機能を搭載:テクノロジーの未来への一端

Microsoft(マイクロソフト)は、次世代のWindows OSの大規模なアップデート「ハドソンバレー」と呼ばれるものを熱心に開発し...

AI研究

中国からのニューエーアイ研究は、GLM-130Bを紹介しますこれは、13兆のパラメータを持つバイリンガル(英語と中国語)のプリトレーニング言語モデルです

最近、大規模言語モデル(LLM)のゼロショットおよびフューショットの能力は大幅に向上し、100Bパラメータ以上を持つモデルは...

機械学習

メタのボイスボックス:すべての言語を話すAI

Facebookの親会社であるMetaは画期的な開発を発表し、最新の生成型人工知能(AI)であるVoiceboxを公開しました。従来のテキ...

機械学習

CLIP基礎モデル

この記事では、CLIP(対照的な言語画像事前学習)の背後にある論文を詳しく解説しますキーコンセプトを抽出し、わかりやすく...