メタは、商用利用に無料のLLaMA 2をリリースしました

META released the free LLaMA 2 for commercial use.

Llama 2、私たちのオープンソースの大規模言語モデルの次世代

これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。

Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。

新機能は何ですか?

事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています

これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。

このモデルは3つのバージョンで提供されます —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。

最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。

  • コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
  • モデルは2兆個のトークンでトレーニングされています。
  • 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
  • モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。

ベンチマーク:

このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。

標準テストの一連のテスト

人間の評価者による評価…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「人工知能(AI)におけるアナログコンピュータの使用」

アナログコンピュータは、電気の電圧、機械の動き、または流体の圧力などの物理的な量を、解決すべき問題に対応する量に類似...

AIニュース

「You.comがYouRetrieverをリリース:You.comの検索APIへの最もシンプルなインターフェース」

You.comは、You.com Search APIへの最もシンプルなインターフェースであるYouRetrieverをリリースしました。 You.com Search ...

データサイエンス

Transcript AIコンテンツの生成を検出する

「生成AIの進歩に伴う多くの興味深い倫理的問題の1つは、モデルの成果物の検出ですこれは、メディアを消費する私たちにとって...

AIニュース

「トロリー問題を捨てて、自律型自動車の道徳的な決定を支援する」

北カロライナ州立大学の研究者たちは、低リスクの交通状況における道徳的な課題に関するより現実的なデータを収集するために...

機械学習

このAI論文は、自律言語エージェントのためのオープンソースのPythonフレームワークである「Agents」を紹介しています

カスタマーサービス、コンサルティング、プログラミング、執筆、教育などのタスクでは、言語エージェントは人間の労力を削減...

AI研究

新しいAI研究がGPT4RoIを紹介します:地域テキストペアに基づくInstruction Tuning大規模言語モデル(LLM)によるビジョン言語モデル

大型言語モデル(LLM)は最近、自然言語処理を必要とする会話タスクで驚異的なパフォーマンスを発揮し、大きな進歩を遂げてい...