イレブンラボは、30言語に対応するAI音声モデル「イレブンマルチリンガルv2」をリリースしました

イレブンラボは、30言語に対応するAI音声モデルをリリースしました

ElevenLabsによる最新の研究では、Eleven Multilingual v2と呼ばれる多言語音声生成モデルが公開され、約30の言語で「感情豊かな」AIオーディオを生成します。この研究により、プロデューサーはヨーロッパ、アジア、中東市場向けにオーディオをローカライズすることが可能になります。

研究チームは18か月間にわたり人間の音声指標を研究し、文脈の検出、音声生成における感情の表現、新たな特徴的な声の合成のための新しい手法を開発しました。このモデルは約30の書かれた言語を自動的に認識し、ElevenLabsのテキスト読み上げプラットフォームにテキストが入力されると、これまでにないレベルの本物さで声を生成します。

複製または合成された声は、話者の母国語のアクセントなど、すべての話される言語で話者の声の特徴的な特性を保持します。これにより、同じ声を28の異なる言語で利用して素材をアニメーション化することが可能になりました。

この発表は、プラットフォーム上ですべてのユーザーがプロフェッショナルな音声複製を利用できるようになった後に行われました。このアップデートでは、改善されたセキュリティと保護策とともに、オリジナルとほとんど区別がつかないデジタルな声の複製が作成できるようになりました。既存の言語(英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語)に加えて、新しいモデルでは中国語、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、フィリピン語、日本語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレーシア語、スロバキア語、クロアチア語、クラシックアラビア語、タミル語もサポートされています。

ElevenLabsは、新しい機能の導入と継続的な改良に続いて、本日プラットフォームがベータ版を終了することを確認しました。この変更は、同社が信頼性の高い最新のリソースを提供し、世界中の100万人以上のユーザーにサービスを提供するという同社の取り組みを象徴しています。

ElevenLabsはまた、ユーザーがAIと協力してプラットフォームを介して新しいオーディオを作成できる方法に取り組んでいます。

テキスト読み上げを多言語に対応させることで、視覚障害を持つ人や他の学習要件を持つ人々に対して、視覚的なコンテンツへのアクセスをより容易にするアプリケーションです。以下にいくつかの例を示します:

  1. 多言語音声生成ツールにより、インディーゲーム開発者やパブリッシャーはゲームの体験や音声コンテンツを国際的な観客に翻訳し、品質や正確さを損なうことなく、彼らの言語でプレイヤーやリスナーとつながることができます。
  2. 同様に、学校は今や学生に対して目標言語で高品質なネイティブスピーカーの音声コンテンツにタイムリーにアクセスできるリソースを提供することができ、学生のリスニングと発音の能力を向上させ、国際的な学生のニーズに対応するさまざまな教育上の選択肢を満たすことができます。

ElevenLabsは、多言語で高品質な音声を制作するために必要な時間と費用を削減することで、ビジネスやクリエイターが、あらゆるバックグラウンドや言語の人々に理解されるよりオリジナルでアクセスしやすいコンテンツを制作するのを支援しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「GoogleのAIの驚異的な進化、GeminiとゲームチェンジャーのStubbsを紹介します」

AIの生成を基本的なツールやサービスに統合しようという動きは、急速に変化するデジタルエコシステムにおいて活発な闘いに発...

データサイエンス

十年生のためのニューラルネットワークの簡略化

複雑なニューラルネットワークの概念を、コスト関数、ニューロン、バックプロパゲーション、重みとバイアスを非技術的で楽し...

データサイエンス

アマゾンの研究者は、深層学習を活用して複雑な表形式のデータ分析におけるニューラルネットワークを強化します

ニューラルネットワークは、異質なカラムを持つ表形式のデータに直面するときに、現代計算の驚異として、重要なハードルに直...

データサイエンス

「良い説明がすべてです」

私は大規模な言語モデル(LLM)をしばらく使っていますが、個人のプロジェクトや日常の仕事の一環として使用しています多くの...

AI研究

中国からのニューエーアイ研究は、GLM-130Bを紹介しますこれは、13兆のパラメータを持つバイリンガル(英語と中国語)のプリトレーニング言語モデルです

最近、大規模言語モデル(LLM)のゼロショットおよびフューショットの能力は大幅に向上し、100Bパラメータ以上を持つモデルは...

AI研究

Salesforce AIは、既存の拡散モデルを与えられた場合に、テキストから画像への拡散生成を行う新しい編集アルゴリズム「EDICT」を開発しました

最近のテクノロジーと人工知能の分野における進歩により、多くのイノベーションが生まれています。超トレンディなChatGPTモデ...