「英語のアクセント分類のための機械学習パイプラインの構築」
Building a machine learning pipeline for English accent classification
オーディオベースの機械学習分類モデルを構築し、一般的な英語のアクセントに対応する方法と、Hugging Faceを通じて実現するためのステップバイステップガイド
ますますつながりのある世界では、コミュニケーションには制約がありません。異なるコミュニティが国境や文化を超えて交流する中で、アクセントの理解は効果的なコミュニケーションの重要な要素となっています。正確な英語のアクセント分類システムは、言語の障壁を取り除き、音声認識システムを向上させ、言語学習ツールを改善し、個別のユーザーエクスペリエンスにも役立つ潜在能力を持っています。以下では、このようなシステムを開発する方法について詳しく説明し、円滑かつ包括的なコミュニケーションを促進するための多くの応用例を明らかにします。
データの選択、サンプリング、変換
データの選択、サンプリング、変換に関する分析は、KaggleのバージョンであるMozillaのCommon Voiceデータセットに基づいています。このデータセットには、さまざまな話者の人口統計情報(話者のアクセントを含む)を含む約500時間の音声録音が含まれています。データセットはCC0:パブリックドメインのライセンスで配布されています。
アクセントに基づくデータサンプルの分布:
- イクイノックスに会いましょう:ニューラルネットワークとsciMLのためのJAXライブラリ
- 「CityDreamerと出会う:無限の3D都市のための構成的生成モデル」
- Google AIは、高いベンチマークパフォーマンスを実現するために、線形モデルの特性を活用した長期予測のための高度な多変量モデル、TSMixerを導入します
アメリカ 30997イギリス 14938インド 4490オーストラリア 4287カナダ 3901スコットランド 1556アフリカ 1173ニュージーランド 1153アイルランド 944フィリピン 326ウェールズ 262バミューダ 196マレーシア 182シンガポール 124香港 99南大西洋 83
この分布に基づいて、最も一般的な5つのアクセント(アメリカ、イギリス、インド、オーストラリア、カナダ)を選択し、サンプル分布をアンダーサンプリングしました:
# 全てのマイナリティクラス以外をランダムにアンダーサンプリングrus = RandomUnderSampler(random_state=83, sampling_strategy='not minority')y = dd[['label']]dd = dd.drop(['label']…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- ジャクソン・ジュエットは、より少ないコンクリートを使用する建物の設計をしたいと考えています
- 「YaRNに会ってください:トランスフォーマーベースの言語モデルのコンテキストウィンドウを拡張するための計算効率の高い方法で、以前の方法よりもトークンが10倍少なく、トレーニングステップが2.5倍少なくて済みます」
- 「テンソル量子化:語られなかった物語」
- 「ステーブル拡散」は実際にどのように機能するのでしょうか?直感的な説明
- 「Amazon SageMaker Pipelinesを使用した機械学習ワークフローの構築のためのベストプラクティスとデザインパターン」
- BYOL(Bootstrap Your Own Latent)— コントラスティブな自己教示学習の代替手段
- 「生成AIにおけるLLMエージェントのデコーディングの機会と課題」