Google DeepMindとYouTubeの研究者は、Lyriaという高度なAI音楽生成モデルを発表しました

Google DeepMindとYouTubeの研究者による最新研究:AI音楽生成モデル「Lyria」の登場

最近の発表では、GoogleのDeepMindがYouTubeとの協力のもと、芸術的表現の風景を変えるであろう音楽生成モデルLyriaを発表しました。この革新的なテクノロジーは、Dream TrackとMusic AIの2つの実験的ツールセットとともに、AI支援の音楽制作において重要な進展を示し、ミュージシャンやクリエイターが自身のクラフトとの関わり方を再定義することを約束します。

Lyriaの発表は、Googleが以前に単語のプロンプトに基づいて曲を生成するAI技術を試みたことに続きます。今度はDeepMindのLyriaモデルが注目され、YouTubeとの協力を通じてクリエイターがその潜在能力を活用できるようになります。画期的なツールであるDream Trackでは、クリエイターがYouTube Shorts向けにAI生成のサウンドトラックを手掛け、著名アーティストの個性的な音楽スタイルに没入することができます。

しかし、音楽制作におけるAIの役割については、AI生成の作品の信頼性と持続可能性についての懸念も浮上しています。長いフレーズにわたる音楽的連続性の保持の複雑さは、AIモデルにとっての課題となります。DeepMindはこれを認識し、長時間にわたって意図した音楽的な結果を保つことの難しさを強調し、時間の経過によるシュールな歪みをもたらす可能性があります。

DeepMindとYouTubeは、これらの課題を軽減するために初めに短い音楽作品に重点を置きました。Dream Trackの初回リリースは一部のクリエイターを対象とし、選ばれたアーティストの音楽のエッセンスを似せるように慎重に作り上げた30秒のAI生成サウンドトラックを作り上げる機会を提供します。特筆すべきは、アーティストがこれらのモデルのテストに積極的に参加し、信憑性を確保し貴重な洞察を提供していることです。

この取り組みは、共同作業の性質を強調しています。具体的なアーティスト、作曲家、プロデューサーで構成されたMusic AI Incubatorは、AIツールの改善に積極的に貢献しています。彼らの関与は、創造的なプロセスを向上させながら、AIの限界を探求する意欲の表れです。

Dream Trackは限定リリースですが、Music AIツールの一般展開は今年後半に続きます。DeepMindは、特定の楽器やフミフミで音楽を作成し、簡単なMIDIキーボードの入力からアンサンブルを作曲し、既存のボーカルラインに伴奏する楽曲を制作するなど、これらの能力をうかがわせる魅力的なヒントを与えています。

AI生成音楽へのGoogleの進出は単独のものではありません。MetaのオープンソースのAI音楽生成器や、Stability AIやRiffusionなどのスタートアップからのイニシアチブも、音楽業界がAI駆動のイノベーションを受け入れる加速度的な変化を示しています。これらの進歩により、業界は変革を迎える準備ができています。

AIと創造性が交差する領域で、AI音楽生成における最も重要な問いは、AI作品が音楽の新たな標準となるのかということです。不確定要素が存在する中で、DeepMindとYouTubeの協力関係は、AI生成音楽がその信頼性を保ちながら人間の創造性を補完することを保証するための共同の努力を示しています。

テクノロジーとアートが交錯する領域で、DeepMindとYouTubeのAI音楽生成への取り組みは、革新と芸術的表現が調和して音楽創造の本質を再定義する有望な未来を示唆しています。

この投稿は、Google DeepmindとYouTubeの研究者が発表したLyria: 高度なAI音楽生成モデル が最初に掲載されました – MarkTechPost.

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「良い説明がすべてです」

私は大規模な言語モデル(LLM)をしばらく使っていますが、個人のプロジェクトや日常の仕事の一環として使用しています多くの...

機械学習

誰が雨を止めるのか? 科学者が気候協力を呼びかける

トップの科学者3人が、コンピューティング史上最も野心的な取り組みの一環として、地球のデジタルツインの構築を支援していま...

機械学習

「MM-VID for GPT-4V(ision)による進化するAIビデオ理解の解放」

世界中で、個人は毎日さまざまなビデオを作成しています。ユーザー生成のライブストリーム、ビデオゲームのライブストリーム...

機械学習

「MindGPTとは、fMRI信号から察知された視覚刺激を自然言語に解釈する非侵襲的な神経デコーダーです」

他の人とコミュニケーションを取るために、人間は外界で見たことを説明するために限られた量の言葉しか使うことができません...

機械学習

悪質なコンテンツ検出のためのLLM:利点と欠点

この投稿では、インターネット上の有害なコンテンツを特定するための2つの異なる方法を評価しますそれは、教師あり分類器のト...

機械学習

「シュレディンガー・ブリッジはテキスト・トゥ・スピーチ(TTS)合成において拡散モデルに勝るものになっていますか?」

人工知能の進歩に伴い、自然言語処理、自然言語生成、コンピュータビジョンの分野は、最近大きな人気を得ています。これは、...