「英語のアクセント分類のための機械学習パイプラインの構築」

Building a machine learning pipeline for English accent classification

オーディオベースの機械学習分類モデルを構築し、一般的な英語のアクセントに対応する方法と、Hugging Faceを通じて実現するためのステップバイステップガイド

Photo by Kane Reinholdtsen on Unsplash

ますますつながりのある世界では、コミュニケーションには制約がありません。異なるコミュニティが国境や文化を超えて交流する中で、アクセントの理解は効果的なコミュニケーションの重要な要素となっています。正確な英語のアクセント分類システムは、言語の障壁を取り除き、音声認識システムを向上させ、言語学習ツールを改善し、個別のユーザーエクスペリエンスにも役立つ潜在能力を持っています。以下では、このようなシステムを開発する方法について詳しく説明し、円滑かつ包括的なコミュニケーションを促進するための多くの応用例を明らかにします。

データの選択、サンプリング、変換

データの選択、サンプリング、変換に関する分析は、KaggleのバージョンであるMozillaのCommon Voiceデータセットに基づいています。このデータセットには、さまざまな話者の人口統計情報(話者のアクセントを含む)を含む約500時間の音声録音が含まれています。データセットはCC0:パブリックドメインのライセンスで配布されています。

アクセントに基づくデータサンプルの分布:

アメリカ            30997イギリス           14938インド               4490オーストラリア       4287カナダ             3901スコットランド       1556アフリカ             1173ニュージーランド     1153アイルランド         944フィリピン         326ウェールズ           262バミューダ           196マレーシア           182シンガポール         124香港                 99南大西洋             83

この分布に基づいて、最も一般的な5つのアクセント(アメリカ、イギリス、インド、オーストラリア、カナダ)を選択し、サンプル分布をアンダーサンプリングしました:

# 全てのマイナリティクラス以外をランダムにアンダーサンプリングrus = RandomUnderSampler(random_state=83, sampling_strategy='not minority')y = dd[['label']]dd = dd.drop(['label']…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

自然言語処理:BERTやGPTを超えて

技術の世界は常に進化しており、その中でも特に進歩が見られる分野の一つが自然言語処理(NLP)です数年前には、BERTとGPTと...

AIニュース

メタが「AudioCraft」を発表:テキストを音声や音楽に変換するためのAIツール

Metaは、Facebook、Instagram、WhatsAppなどのソーシャルメディアプラットフォームを展開しているテックジャイアントであり、...

人工知能

ジオのHaptikがビジネス向けのAIツールを立ち上げました

インドの人工知能スタートアップ、Haptikは、Reliance Jio Infocommの一部であり、ビジネスクライアントが仮想アシスタントと...

機械学習

このAI論文では、「Lightning Cat」というスマート契約の脆弱性検出ツールを紹介していますこれは、深層学習をベースにしたツールです

スマートコントラクトは、分散型アプリケーションの開発においてブロックチェーン技術で重要な役割を果たしています。スマー...

AI研究

メイヨークリニックのAI研究者たちは、拡散モデルを活用したマルチタスク脳腫瘍インペインティングアルゴリズムを構築するための機械学習ベースの手法を紹介しました

近年、医用画像に関連するAI、特に機械学習(ML)に関する出版物の数は急増しています。Meshキーワード「人工知能」と「放射...

AIニュース

「GPTBotの公開:OpenAIがウェブのクロールに踏み出す大胆な一手」

デジタル革新の渦中で、OpenAIはGPTBotというウェブクローラーをリリースすることで注目を浴びています。この取り組みはAIの...