メタは、商用利用に無料のLLaMA 2をリリースしました

META released the free LLaMA 2 for commercial use.

Llama 2、私たちのオープンソースの大規模言語モデルの次世代

これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。

Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。

新機能は何ですか?

事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています

これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。

このモデルは3つのバージョンで提供されます —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。

最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。

  • コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
  • モデルは2兆個のトークンでトレーニングされています。
  • 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
  • モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。

ベンチマーク:

このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。

標準テストの一連のテスト

人間の評価者による評価…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

ソルボンヌ大学の研究者は、画像、ビデオ、音声、言語のタスクに対する統合AIモデル「UnIVAL」を紹介しました

一般的なモデルを作成するための大きな進歩の一つは、大規模な言語モデル(LLM)の出現です。彼らの驚異的なテキスト理解およ...

機械学習

「生成的なAIアプリケーションと3D仮想世界の構築方法」

成長し成功するためには、組織は特に生成AIや3D仮想世界のような急速に進化する技術領域において、技術スキルの開発に継続的...

AI研究

このAI研究では、「DreamCraft3D」という、結束力のある高精細な3Dモデルを生成するための階層的な手法を紹介しています

“` 2D生成モデリングの信じられないほどの人気は、ビジュアル素材の制作方法に大きな影響を与えています。3Dファブリッ...

AIニュース

顔認識によって食料品店から立ち入り禁止

英国における民間企業による顔認識技術の使用は増加しています

AIニュース

「米国の半導体産業の発展」

米国のチップメーカーは、法律が成立して1年後に政府からの財政支援を待っています

機械学習

『circ2CBAを紹介 circRNA-RBP結合サイトの予測を革新する新しい深層学習モデル』

最近、中国の研究チームが、circular RNAs(circRNAs)とRNA-binding proteins(RBPs)の結合部位の予測を革新すると約束する...