イレブンラボは、30言語に対応するAI音声モデル「イレブンマルチリンガルv2」をリリースしました

イレブンラボは、30言語に対応するAI音声モデルをリリースしました

ElevenLabsによる最新の研究では、Eleven Multilingual v2と呼ばれる多言語音声生成モデルが公開され、約30の言語で「感情豊かな」AIオーディオを生成します。この研究により、プロデューサーはヨーロッパ、アジア、中東市場向けにオーディオをローカライズすることが可能になります。

研究チームは18か月間にわたり人間の音声指標を研究し、文脈の検出、音声生成における感情の表現、新たな特徴的な声の合成のための新しい手法を開発しました。このモデルは約30の書かれた言語を自動的に認識し、ElevenLabsのテキスト読み上げプラットフォームにテキストが入力されると、これまでにないレベルの本物さで声を生成します。

複製または合成された声は、話者の母国語のアクセントなど、すべての話される言語で話者の声の特徴的な特性を保持します。これにより、同じ声を28の異なる言語で利用して素材をアニメーション化することが可能になりました。

この発表は、プラットフォーム上ですべてのユーザーがプロフェッショナルな音声複製を利用できるようになった後に行われました。このアップデートでは、改善されたセキュリティと保護策とともに、オリジナルとほとんど区別がつかないデジタルな声の複製が作成できるようになりました。既存の言語(英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語)に加えて、新しいモデルでは中国語、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、フィリピン語、日本語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレーシア語、スロバキア語、クロアチア語、クラシックアラビア語、タミル語もサポートされています。

ElevenLabsは、新しい機能の導入と継続的な改良に続いて、本日プラットフォームがベータ版を終了することを確認しました。この変更は、同社が信頼性の高い最新のリソースを提供し、世界中の100万人以上のユーザーにサービスを提供するという同社の取り組みを象徴しています。

ElevenLabsはまた、ユーザーがAIと協力してプラットフォームを介して新しいオーディオを作成できる方法に取り組んでいます。

テキスト読み上げを多言語に対応させることで、視覚障害を持つ人や他の学習要件を持つ人々に対して、視覚的なコンテンツへのアクセスをより容易にするアプリケーションです。以下にいくつかの例を示します:

  1. 多言語音声生成ツールにより、インディーゲーム開発者やパブリッシャーはゲームの体験や音声コンテンツを国際的な観客に翻訳し、品質や正確さを損なうことなく、彼らの言語でプレイヤーやリスナーとつながることができます。
  2. 同様に、学校は今や学生に対して目標言語で高品質なネイティブスピーカーの音声コンテンツにタイムリーにアクセスできるリソースを提供することができ、学生のリスニングと発音の能力を向上させ、国際的な学生のニーズに対応するさまざまな教育上の選択肢を満たすことができます。

ElevenLabsは、多言語で高品質な音声を制作するために必要な時間と費用を削減することで、ビジネスやクリエイターが、あらゆるバックグラウンドや言語の人々に理解されるよりオリジナルでアクセスしやすいコンテンツを制作するのを支援しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「深層学習を用いた深層オブジェクト:ZoeDepthはマルチドメインの深度推定のためのAIモデルです」

画像に子供が大人よりも高くて大きく見える錯覚に出くわしたことはありますか?エームスの部屋の錯視は、台形の形状をした部...

AIニュース

「ユネスコ、AIチップの埋め込みに関するプライバシー懸念を指摘」

最近、国連は人工知能(AI)と先進的な神経技術の組み合わせに伴う潜在的な危険性について警告しました。報告によると、脳イ...

機械学習

このAI論文では、アマゾンの最新の機械学習に関する情報が大規模言語モデルのバグコードについて明らかにされています

プログラミングは複雑であり、エラーのないコードを書くことは時には難しいです。コードの大規模言語モデル(Code-LLMs)はコ...

AIニュース

「2023年のAI タイムライン」

はじめに 人工知能(AI)は、技術的な進歩が人間のつながりの本質と共鳴する形で私たちの日常生活と交差する魅力的な領域です...

データサイエンス

エンジニアリングリーダーは何を気にしているのか?

私たちのエンジニアリングリーダーズフォーラム ラウンドテーブルのまとめと、VPたちがAI、ChatGPT、リモートワーク、DORAメ...