スタビリティAIが日本語のStableLMアルファを発表:日本語言語モデルの飛躍的な進化

Stability AI announces Japanese StableLM Alpha significant evolution of Japanese language model

日本の生成型AIの領域を向上させる重要な一歩として、Stability AIは、Stable Diffusionを開発した先駆的な生成型AI企業として、日本語言語モデル(LM)であるJapanese StableLM Alphaを初めて発表しました。この画期的なローンチは、同社のLMが日本語話者向けに提供される最も優れた公開モデルであるという主張によって注目を集めています。この主張は、他の4つの日本語LMとの包括的なベンチマーク評価によって裏付けられています。

この新しく導入されたJapanese StableLM Alphaは、70億のパラメータを持つ印象的なアーキテクチャを誇り、Stability AIの技術進歩への取り組みを証明しています。このモデルは、さまざまな言語タスクに対応できる多目的で高性能なツールです。その優れた性能は、複数のカテゴリーで競合他社を凌駕し、業界のリーダーとしての地位を確立しています。

日本語のStableLM Base Alpha 7Bの商業版は、広く認知されているApache License 2.0の下でリリースされる予定です。この専門モデルは、オンラインリポジトリから入手した日本語と英語のテキストの7500億トークンを網羅した巨大なデータセットによる詳細なトレーニングを通じて精巧に作り上げられました。

この成果の基盤は、協力的な取り組みにも負うところがあります。Stability AIは、EleutherAI Polyglotプロジェクトの日本チームの専門知識を活用し、Stability AIの日本コミュニティによって作成されたデータセットを活用しています。この共同の取り組みは、Stability AIの開発プロセスの基盤となるEleutherAIのGPT-NeoXソフトウェアの拡張バージョンの活用によってさらに促進されています。

並行して行われるイノベーションであるJapanese StableLM Instruct Alpha 7Bもまた、注目すべき重要な節目を示しています。このモデルは主に研究目的に開発され、研究アプリケーションに専用です。これは、複数のオープンデータセットを利用した方法論的なアプローチであるSupervised Fine-tuning(SFT)によって、ユーザーの指示に従う特異な能力を発揮します。

これらのモデルは、EleutherAIのLanguage Model Evaluation Harnessを使用して厳密な評価が行われました。モデルは、文の分類、文のペアの分類、質問応答、文の要約など、さまざまなドメインで検証され、平均スコア54.71%という素晴らしい成績を収めました。Stability AIは、この性能指標が日本語のStableLM Instruct Alpha 7Bを他のモデルよりも優れていることを明確に示し、その優位性を強調しています。

興味深いことに、Stability AIの日本語LMのローンチは、ソフトバンクの最近の発表との関連でさらなる興味を引く要素を持っています。先週、ソフトバンクは、日本市場向けに設計された自社製の大型言語モデル(LLM)への参入を発表しました。同社の取り組みは、今年後半にデビュー予定の生成型AIコンピューティングプラットフォームに約200億円(約1億4000万ドル)を投じることによってさらに強調されています。

風景が展開し続ける中、生成型AIのダイナミックで進化する分野で最終的にどの日本語言語モデルが優位性を確立するかを確認するのは待つしかありません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「AIディープフェイクの作り方(初心者向け)」

「AIディープフェイクを作るには、いくつかの技術的なスキルが必要でした...それが、Refaceという便利なツールが登場するまで...

データサイエンス

「LLMの幻覚の理解と軽減」

最近、大型言語モデル(LLM)は、ユーザーのプロンプトに対して非常に流暢で説得力のある応答を生成するなど、印象的かつ増大...

AI研究

ジュネーブ大学の研究者は、多剤耐性(MDR)腸内細菌感染の入院リスクを予測するためのグラフベースの機械学習モデルを調査しています

マシンラーニングは、医療で非常に重要なツールとして登場し、業界のさまざまな側面を革新しています。その主な応用の一つは...

人工知能

宇宙におけるAIの10の使用例

イントロダクション 何百年もの間、人々は夜空を見つめ、好奇心を抱いてきました。現在でもその興味は輝き続けています。宇宙...

機械学習

トランスフォーマーにおけるセルフアテンション

「初心者にやさしいセルフアテンションガイドセルフアテンションは、AIの現在の進歩の中で鍵となる「トランスフォーマー」の...

人工知能

動的に画像のサイズを調整する

この投稿では、Apache APISIXをimgproxyと組み合わせて使用する方法について、複数の解像度で画像の保存コストを削減する方法...