スタビリティAIが日本語のStableLMアルファを発表:日本語言語モデルの飛躍的な進化

Stability AI announces Japanese StableLM Alpha significant evolution of Japanese language model

日本の生成型AIの領域を向上させる重要な一歩として、Stability AIは、Stable Diffusionを開発した先駆的な生成型AI企業として、日本語言語モデル(LM)であるJapanese StableLM Alphaを初めて発表しました。この画期的なローンチは、同社のLMが日本語話者向けに提供される最も優れた公開モデルであるという主張によって注目を集めています。この主張は、他の4つの日本語LMとの包括的なベンチマーク評価によって裏付けられています。

この新しく導入されたJapanese StableLM Alphaは、70億のパラメータを持つ印象的なアーキテクチャを誇り、Stability AIの技術進歩への取り組みを証明しています。このモデルは、さまざまな言語タスクに対応できる多目的で高性能なツールです。その優れた性能は、複数のカテゴリーで競合他社を凌駕し、業界のリーダーとしての地位を確立しています。

日本語のStableLM Base Alpha 7Bの商業版は、広く認知されているApache License 2.0の下でリリースされる予定です。この専門モデルは、オンラインリポジトリから入手した日本語と英語のテキストの7500億トークンを網羅した巨大なデータセットによる詳細なトレーニングを通じて精巧に作り上げられました。

この成果の基盤は、協力的な取り組みにも負うところがあります。Stability AIは、EleutherAI Polyglotプロジェクトの日本チームの専門知識を活用し、Stability AIの日本コミュニティによって作成されたデータセットを活用しています。この共同の取り組みは、Stability AIの開発プロセスの基盤となるEleutherAIのGPT-NeoXソフトウェアの拡張バージョンの活用によってさらに促進されています。

並行して行われるイノベーションであるJapanese StableLM Instruct Alpha 7Bもまた、注目すべき重要な節目を示しています。このモデルは主に研究目的に開発され、研究アプリケーションに専用です。これは、複数のオープンデータセットを利用した方法論的なアプローチであるSupervised Fine-tuning(SFT)によって、ユーザーの指示に従う特異な能力を発揮します。

これらのモデルは、EleutherAIのLanguage Model Evaluation Harnessを使用して厳密な評価が行われました。モデルは、文の分類、文のペアの分類、質問応答、文の要約など、さまざまなドメインで検証され、平均スコア54.71%という素晴らしい成績を収めました。Stability AIは、この性能指標が日本語のStableLM Instruct Alpha 7Bを他のモデルよりも優れていることを明確に示し、その優位性を強調しています。

興味深いことに、Stability AIの日本語LMのローンチは、ソフトバンクの最近の発表との関連でさらなる興味を引く要素を持っています。先週、ソフトバンクは、日本市場向けに設計された自社製の大型言語モデル(LLM)への参入を発表しました。同社の取り組みは、今年後半にデビュー予定の生成型AIコンピューティングプラットフォームに約200億円(約1億4000万ドル)を投じることによってさらに強調されています。

風景が展開し続ける中、生成型AIのダイナミックで進化する分野で最終的にどの日本語言語モデルが優位性を確立するかを確認するのは待つしかありません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

シカゴ大学と東京大学との量子コンピューティングパートナーシップ

東京大学、シカゴ大学、そしてGoogleは、量子情報科学とエンジニアリングに関する戦略的パートナーシップを確立しました

機械学習

「人工知能(AI)におけるアナログコンピュータの使用」

アナログコンピュータは、電気の電圧、機械の動き、または流体の圧力などの物理的な量を、解決すべき問題に対応する量に類似...

AIニュース

Google Pixel Watchが落下を検知する方法

Google Pixel Watchの落下検知機能をスタントダブルからAIまでどのように構築したかを学びましょう

データサイエンス

トロント大学の研究者が、大規模な材料データセットにおける驚くべき冗長性と、情報豊かなデータの機械学習パフォーマンスの向上における力を明らかにする

AIの登場と共に、その利用は私たちの生活のあらゆる分野で感じられるようになっています。AIはあらゆる生活領域での応用が見...

人工知能

ソロプレナーズ向けの11の最高のAIツール(究極のAIツールキット)

これらは、独自で自分の百万ドルの帝国を築くために、独立起業家が使用している最高のAIツールです

データサイエンス

「生成AIにおけるバイアスの軽減」

イントロダクション 現代の世界では、生成型AIは創造性の限界を押し広げており、機械が人間のようなコンテンツを作り出すこと...