メタは、商用利用に無料のLLaMA 2をリリースしました

META released the free LLaMA 2 for commercial use.

Llama 2、私たちのオープンソースの大規模言語モデルの次世代

これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。

Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。

新機能は何ですか?

事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています

これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。

このモデルは3つのバージョンで提供されます —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。

最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。

  • コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
  • モデルは2兆個のトークンでトレーニングされています。
  • 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
  • モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。

ベンチマーク:

このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。

標準テストの一連のテスト

人間の評価者による評価…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「トランスフォーマーアーキテクチャとBERT、GPT、T5の台頭:初心者向けガイド」

「人工知能(AI)の広大で絶えず進化する領域において、印象を残すだけでなく、その全体の軌道を再定義する革新が存在します...

データサイエンス

データのセキュリティとコラボレーションの強化:AWS Clean Roomsが機械学習と差分プライバシー機能を導入

Amazon Web Services(AWS)は、セキュアなデータ共有サービスであるClean Roomsの新しいアップデートを発表しました。このア...

AI研究

ETHチューリッヒの研究者が、バイオミメティックな腱駆動式ファイブハンドを紹介:高次元自由度の3Dプリンタ対応設計で、器用な手の回転スキルを持つ

従来のモデルベースの制御手法では、コントローラーはロボットの動的モデルと直接的に対話します。最近の研究では、ロボット...

機械学習

「画像の匿名化はコンピュータビジョンのパフォーマンスにどのような影響を与えるのか? 伝統的な匿名化技術とリアルな匿名化技術の比較」

画像匿名化は、識別可能な特徴をぼかすことにより、個人のプライバシーを保護するために視覚データを変更することを指します...

AI研究

このAI研究は、FireActを提案しますこれは、複数のタスクとエージェントの手法からの軌跡を使用して、言語モデルを微調整するための新しい人工知能の手法です

ファインチューニングされた言語モデルは、しばしば言語エージェントを作成する際に軽視され、特にGoogle検索APIを使用して質...