AudioCraft Metaの音声と音楽のための生成AI

AudioCraft Metaの音声と音楽生成AI

Facebookの親会社であるMetaは、テキストベースのプロンプトから音を生成する新しい生成AIツールを発表しました。同社は投稿で思考実験を始めます。「楽器で一つの音符も奏でずに、プロのミュージシャンが新しい作曲を探求できると想像してください。」

このような重要な言葉が、同社から出てくるということは、新しいAIツールが高品質でリアルなオーディオと音楽をテキストのプロンプトから生成できると主張しているということです。さらに興味深いことに、これは生成AIコンテンツに対するより厳格な監視が行われている時期に発表されました。

投稿によると、新しいAIツールの名前はAudioCraftで、3つのモデルから構成されています。MusicGen、AudioGen、そしてEnCodecです。最初のMusicGenは、Meta自身のライセンス付き音楽を使用してトレーニングされ、テキストのプロンプトから音楽を生成することができます。

公開された音響効果を使用してトレーニングされたAudioGenも、テキストのプロンプトから音を生成することができます。環境音や犬の吠え声、車のクラクション、足音、特定の種類の床など、他の音効を作成することができます。

これら2つのモデルの違いは、音楽の作成と後者に焦点を当てた音効です。そして、Encodecです。同社によれば、このモデルはより少ないアーティファクトを持つ高品質の音楽生成が可能です。

これら3つのモデルはオープンソース化され、研究者や実践者が自身のデータセットでモデルをトレーニングできるようになっています。AIによる音楽と音の生成の世界はまだ幼いため、その結果は非常に興味深いものになるかもしれません。

現時点では、モデルは単にプロンプトを書き込んで魅力的な音が生成されるのを待つだけでは利用できません。複雑な性質を持つため、モデルにはさらなる作業が必要とされています。しかし、チームはAudioCraftモデルの家族が高品質のオーディオを生成できると約束しています。

同社は、AudioCraftモデルの家族がミュージシャンやサウンドデザイナーが自身の技術を探求するための新しいツールとして認識されることを期待しています。また、彼らの仕事にインスピレーションを与えることも期待しています。もし成功し、人気が出れば、これがDJデビッド・ゲッタが音楽の未来においてAIが重要な役割を果たすと述べた未来になるでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

コンピュータサイエンス

ロボット犬は、人間よりも侵略的なヒアリの巣をより良く見つけることができます

中国とブラジルの科学者たちは、侵入した火蟻の巣を検出するために、ロボット犬と人工知能(AI)をテストしています

データサイエンス

イーロン・マスク氏とXAiチームがGrokを発表:人工知能(AI)の新たなフロンティア、ライブデータとChatGPTに対する最強の競合相手

イーロン・マスクは、宇宙と電気自動車に対する野心的な取り組みで知られるテック界の大物であり、現在は急成長している人工...

AIニュース

「ロボタクシーがサンフランシスコを回るにつれて敵を作り出している」

サンフランシスコでのロボタクシーサービスの拡大について最近承認を受けたにもかかわらず、WaymoとCruiseは交通と安全に関す...

データサイエンス

日本の介護施設はビッグデータを活用して介護士の支援を強化し、業務負担を軽減しています

日本の介護施設運営会社であるSompo Holdingsは、技術を活用して日本の介護人材不足を緩和しています

機械学習

「ゲームを一段と盛り上げる:スタートアップのスポーツビジョンAIが世界中にアスレチックを放送」

Pixellotは、ビジョンAIによって得点を稼いでおり、各国の視聴者にリアルタイムのスポーツ放送と分析を提供する組織にとって...

人工知能

中途の旅行 vs 安定した拡散:AI画像生成器の戦い

「Midjourney vs Stable Diffusion、あなたにとって最適なのはどちら?両方のAI画像生成機の強みと弱みを探ってみましょう」