「DeepMind AIが数百万の動画のために自動生成された説明を作成することで、YouTube Shortsの露出を大幅に向上させる」

DeepMind AIがYouTube Shortsの露出を大幅に向上させるために、数百万の動画の自動生成説明を作成する

DeepMindは、YouTubeとの共同作業で、YouTube Shortsビデオの検索性を向上させるために設計された最先端のAIモデル「Flamingo」を発表しました。これらの短い動画クリップは、人気のあるプラットフォームTikTokに似ており、より具体的な内容を見つけやすくするために、より説明的なテキストと意味のあるタイトルが必要です。しかし、Flamingoの導入により、ユーザーはこれらの動画をより簡単に発見する方法を持つようになりました。

Flamingoは、YouTube Shortsビデオの初期フレームを分析して説明的なテキストを生成するために、高度なビジュアル言語モデルを使用しています。たとえば、「猫が羊毛のボールで遊んでいる」というように、シーンを説明することができます。この生成されたテキストはメタデータとして保存され、効率的なビデオ分類と検索エンジンのアクセシビリティの向上を可能にします。

Flamingoの影響はすでに見られており、数十万件の新しくアップロードされたShortsビデオがAIによる説明を受けています。YouTubeは徐々にこの技術をすべてのShortsビデオに導入する予定であり、世界中の視聴者にとって見つけやすくすることを目指しています。

Flamingoは、DeepMindとYouTubeの最新の共同作業であり、Googleが4月に発表したDeepMindとGoogle Brainの統合AIビジネスグループへの融合をさらに固めています。彼らの以前の共同事業には、DeepMindのAIモデルMuZeroを利用して、YouTubeのVP9コーデックの圧縮伝送を向上させるものがあります。さらに、DeepMindとYouTubeは2018年に、広告とYouTubeのポリシーを一致させることによって収益を最大化する方法をビデオクリエーターに教育するために協力しました。このパートナーシップにより、ラベル品質モデル(LQM)の開発が行われ、精度の向上した広告の正確なコンテンツラベリングが保証され、プラットフォーム上の視聴者、クリエーター、広告主の信頼を築きました。

フルーツフルな共同作業を続けるDeepMindとYouTubeは、ビデオチャプターの導入によりユーザーエクスペリエンスを向上させるために取り組んできました。この開発により、ビデオとオーディオのコンテンツの転写を自律的に処理し、チャプターのセグメンテーションとタイトルの提案を行うAIシステムが作成されました。この革新的な機能であるAutoChaptersは、Google I/O 2022でCEOのSundar Pichaiによって発表されました。AutoChaptersにより、ユーザーは手間のかかる長いビデオを検索する必要がなくなり、AIシステムが迅速に重要なセクションを特定します。この機能はすでに800万件のビデオで使用されており、DeepMindは今後1年間で8000万件のビデオにその実装を拡大する予定です。

Flamingoに関して、YouTube Shorts制作チームは、AIモデルによって生成されるメタデータはクリエーターには表示されないことを明確にしています。主な焦点は、検索の正確性を大幅に向上させることです。また、Googleは、Flamingoによって生成されるテキストが厳格な責任基準に準拠しており、ビデオコンテンツのネガティブな表現を避けていることを保証しています。

YouTube Shortsビデオの検索性を革新するFlamingoが始動するにあたり、そのAIラベリングの精度は厳密に監視されるでしょう。AI技術の進化する時代において、FlamingoはDeepMindとYouTubeの共同作業の証です。彼らの共同の努力により、彼らはAIイノベーションの境界を再定義し、クリエーターと視聴者の両方にとってより魅力的でアクセスしやすい環境を育んでいます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

Google Gemini APIを使用してLLMモデルを構築する

導入 ChatGPTとOpenAIのGPTモデルのリリース、およびMicrosoftとのパートナーシップにより、AIの領域にTransformerモデルをも...

機械学習

Mozilla Common Voiceでの音声言語認識-第II部:モデル

これはMozilla Common Voiceデータセットに基づく音声認識に関する2番目の記事です最初の部分ではデータの選択と最適な埋め込...

機械学習

NODE:表形式に特化したニューラルツリー

近年、機械学習は人気が爆発し、ニューラルディープラーニングモデルは画像やテキストなどの複雑なタスクにおいて、XGBoost [...

機械学習

ビッグテックと生成AI:ビッグテックが生成AIを制御するのか?

「ビッグテックと生成AIの深まる関係を探求する:これらの巨人はセクターを支配するのか、それともバランスの取れたAIの景観...

データサイエンス

「モデルの解釈性のためのPFIに深く入り込む」

「モデルの評価方法を知っていることは、データサイエンティストとしての仕事において不可欠ですステークホルダーに完全に理...

AI研究

2023年にフォローすべきトップ10のAIインフルエンサー

イントロダクション 先端技術と驚くべき可能性によって駆動される世界で、AIの絶えず進化する領域に遅れをとらないことは、ス...