メタは、商用利用に無料のLLaMA 2をリリースしました

META released the free LLaMA 2 for commercial use.

Llama 2、私たちのオープンソースの大規模言語モデルの次世代

これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。

Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。

新機能は何ですか?

事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています

これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。

このモデルは3つのバージョンで提供されます —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。

最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。

  • コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
  • モデルは2兆個のトークンでトレーニングされています。
  • 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
  • モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。

ベンチマーク:

このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。

標準テストの一連のテスト

人間の評価者による評価…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

リーンで、意味ありげなAI夢マシン:DejaVuは知能を失わずにAIとのおしゃべりコストを削減しる

大規模言語モデルのトレーニングには、強力なGPUやTPU、AIアクセラレータなどの専用ハードウェアなどの高度な計算リソースが...

機械学習

このAI論文は、高度な潜在的一致モデルとLoRA蒸留によってテキストから画像を生成するタスクを革新するLCM-LoRAを紹介しています

潜在拡散モデルは機械学習における生成モデルであり、特に確率モデリングで使用されます。これらのモデルはデータセットの潜...

人工知能

SalesforceのLive Call Analyticsによる統合でエージェントの生産性を向上させる

コンタクトセンターエージェントとして、生産的な顧客との会話に集中することが好きですか?それとも、さまざまなシステムに...

機械学習

「TR0Nに会ってください:事前学習済み生成モデルに任意のコンディショニングを追加するためのシンプルで効率的な方法」

最近、大規模な機械学習モデルが様々なタスクで優れた成績を収めています。しかし、このようなモデルのトレーニングには多く...

AIニュース

「Amazon SageMaker StudioでAmazon SageMaker JumpStartを使用して安定したDiffusion XLを利用する」

「今日、私たちはお知らせすることを喜んでいますStable Diffusion XL 1.0(SDXL 1.0)がAmazon SageMaker JumpStartを通じて...

コンピュータサイエンス

「教師たちはAIチュータリングボットを試験にかける」

ニュージャージー州ニューアークの3つの公立学校では、教育非営利団体であるカーンアカデミーの人工知能(AI)支援教材のテス...