イレブンラボは、30言語に対応するAI音声モデル「イレブンマルチリンガルv2」をリリースしました

イレブンラボは、30言語に対応するAI音声モデルをリリースしました

ElevenLabsによる最新の研究では、Eleven Multilingual v2と呼ばれる多言語音声生成モデルが公開され、約30の言語で「感情豊かな」AIオーディオを生成します。この研究により、プロデューサーはヨーロッパ、アジア、中東市場向けにオーディオをローカライズすることが可能になります。

研究チームは18か月間にわたり人間の音声指標を研究し、文脈の検出、音声生成における感情の表現、新たな特徴的な声の合成のための新しい手法を開発しました。このモデルは約30の書かれた言語を自動的に認識し、ElevenLabsのテキスト読み上げプラットフォームにテキストが入力されると、これまでにないレベルの本物さで声を生成します。

複製または合成された声は、話者の母国語のアクセントなど、すべての話される言語で話者の声の特徴的な特性を保持します。これにより、同じ声を28の異なる言語で利用して素材をアニメーション化することが可能になりました。

この発表は、プラットフォーム上ですべてのユーザーがプロフェッショナルな音声複製を利用できるようになった後に行われました。このアップデートでは、改善されたセキュリティと保護策とともに、オリジナルとほとんど区別がつかないデジタルな声の複製が作成できるようになりました。既存の言語(英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語)に加えて、新しいモデルでは中国語、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、フィリピン語、日本語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレーシア語、スロバキア語、クロアチア語、クラシックアラビア語、タミル語もサポートされています。

ElevenLabsは、新しい機能の導入と継続的な改良に続いて、本日プラットフォームがベータ版を終了することを確認しました。この変更は、同社が信頼性の高い最新のリソースを提供し、世界中の100万人以上のユーザーにサービスを提供するという同社の取り組みを象徴しています。

ElevenLabsはまた、ユーザーがAIと協力してプラットフォームを介して新しいオーディオを作成できる方法に取り組んでいます。

テキスト読み上げを多言語に対応させることで、視覚障害を持つ人や他の学習要件を持つ人々に対して、視覚的なコンテンツへのアクセスをより容易にするアプリケーションです。以下にいくつかの例を示します:

  1. 多言語音声生成ツールにより、インディーゲーム開発者やパブリッシャーはゲームの体験や音声コンテンツを国際的な観客に翻訳し、品質や正確さを損なうことなく、彼らの言語でプレイヤーやリスナーとつながることができます。
  2. 同様に、学校は今や学生に対して目標言語で高品質なネイティブスピーカーの音声コンテンツにタイムリーにアクセスできるリソースを提供することができ、学生のリスニングと発音の能力を向上させ、国際的な学生のニーズに対応するさまざまな教育上の選択肢を満たすことができます。

ElevenLabsは、多言語で高品質な音声を制作するために必要な時間と費用を削減することで、ビジネスやクリエイターが、あらゆるバックグラウンドや言語の人々に理解されるよりオリジナルでアクセスしやすいコンテンツを制作するのを支援しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

テキストデータのチャンキング方法-比較分析

自然言語処理(NLP)における「テキストチャンキング」プロセスは、非構造化テキストデータを意味のある単位に変換することを...

機械学習

「LangChain、Activeloop、そしてGPT-4を使用して、Redditのソースコードをリバースエンジニアリングするための分かりやすいガイド」

この記事では、Redditのバージョン1のソースコードをリバースエンジニアリングして、その動作をより理解します

データサイエンス

「ヴォン・グームと出会う 大規模な言語モデルにおけるデータ毒化に対する革新的なAIアプローチ」

データの毒化攻撃は、訓練データセットに誤ったデータを注入することで機械学習モデルを操作します。モデルが実世界のデータ...

人工知能

「先延ばしハック:ChatGPTを使ってプロジェクトをビデオゲームに変える」

「あなたのやるべきことリストを、ドーパミンが絶えず放出されるワクワクするビデオゲームに変えましょう」

人工知能

関数呼び出し:GPTチャットボットを何にでも統合する

OpenAIのGPTの新しい関数呼び出し機能を探索し、チャットボットが外部ツールやAPIと対話できるようにしますAIパワーを活用し...

AI研究

UC BerkeleyとDeepmindの研究者は、SuccessVQAという成功検出の再構成を提案しましたこれは、Flamingoなどの事前学習済みVLMに適したものです

最高のパフォーマンス精度を達成するためには、トレーニング中にエージェントが正しいまたは望ましいトラック上にあるかどう...