イレブンラボは、30言語に対応するAI音声モデル「イレブンマルチリンガルv2」をリリースしました

イレブンラボは、30言語に対応するAI音声モデルをリリースしました

ElevenLabsによる最新の研究では、Eleven Multilingual v2と呼ばれる多言語音声生成モデルが公開され、約30の言語で「感情豊かな」AIオーディオを生成します。この研究により、プロデューサーはヨーロッパ、アジア、中東市場向けにオーディオをローカライズすることが可能になります。

研究チームは18か月間にわたり人間の音声指標を研究し、文脈の検出、音声生成における感情の表現、新たな特徴的な声の合成のための新しい手法を開発しました。このモデルは約30の書かれた言語を自動的に認識し、ElevenLabsのテキスト読み上げプラットフォームにテキストが入力されると、これまでにないレベルの本物さで声を生成します。

複製または合成された声は、話者の母国語のアクセントなど、すべての話される言語で話者の声の特徴的な特性を保持します。これにより、同じ声を28の異なる言語で利用して素材をアニメーション化することが可能になりました。

この発表は、プラットフォーム上ですべてのユーザーがプロフェッショナルな音声複製を利用できるようになった後に行われました。このアップデートでは、改善されたセキュリティと保護策とともに、オリジナルとほとんど区別がつかないデジタルな声の複製が作成できるようになりました。既存の言語(英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語)に加えて、新しいモデルでは中国語、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、フィリピン語、日本語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレーシア語、スロバキア語、クロアチア語、クラシックアラビア語、タミル語もサポートされています。

ElevenLabsは、新しい機能の導入と継続的な改良に続いて、本日プラットフォームがベータ版を終了することを確認しました。この変更は、同社が信頼性の高い最新のリソースを提供し、世界中の100万人以上のユーザーにサービスを提供するという同社の取り組みを象徴しています。

ElevenLabsはまた、ユーザーがAIと協力してプラットフォームを介して新しいオーディオを作成できる方法に取り組んでいます。

テキスト読み上げを多言語に対応させることで、視覚障害を持つ人や他の学習要件を持つ人々に対して、視覚的なコンテンツへのアクセスをより容易にするアプリケーションです。以下にいくつかの例を示します:

  1. 多言語音声生成ツールにより、インディーゲーム開発者やパブリッシャーはゲームの体験や音声コンテンツを国際的な観客に翻訳し、品質や正確さを損なうことなく、彼らの言語でプレイヤーやリスナーとつながることができます。
  2. 同様に、学校は今や学生に対して目標言語で高品質なネイティブスピーカーの音声コンテンツにタイムリーにアクセスできるリソースを提供することができ、学生のリスニングと発音の能力を向上させ、国際的な学生のニーズに対応するさまざまな教育上の選択肢を満たすことができます。

ElevenLabsは、多言語で高品質な音声を制作するために必要な時間と費用を削減することで、ビジネスやクリエイターが、あらゆるバックグラウンドや言語の人々に理解されるよりオリジナルでアクセスしやすいコンテンツを制作するのを支援しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

OpenAIのAPIとBubbleを使用した4つのアプリのアイデア

これが、AIとノーコードを組み合わせて、人々が愛するアプリを作成する方法です

AI研究

初心者のための2023年の機械学習論文の読み方

「私は数十の機械学習の論文を読み、論文の勉強方法がだいたい分かってきました まず最初に、特定の論文を読む目的を理解する...

機械学習

「AIを活用した言語学習のためのパーソナルボイスボット」

新しい言語をマスターする最も効果的な方法は何ですか?話すことです!しかし、他の人の前で新しい単語やフレーズを試すこと...

AIニュース

「新しい取り組みによる輸送とエネルギーの排出削減法」

これらの新製品の特徴と展開は、人々、都市計画者、政策立案者が持続可能な未来を構築するための行動を取るのに役立ちます

データサイエンス

「野心的なAI規制に対する力強いプロセス:オックスフォード研究からの3ステップソリューション」

「もしアカウンタブルマネージャーやプロダクトオーナー、プロジェクトマネージャー、もしくはデータサイエンティストで、AI...

データサイエンス

「PyTorch ProfilerとTensorBoardを使用して、データ入力パイプラインのボトルネックを解消する」

「これは、GPUベースのPyTorchワークロードのパフォーマンス分析と最適化に関するシリーズ投稿の4番目の投稿ですこの投稿では...