メタは、商用利用に無料のLLaMA 2をリリースしました
META released the free LLaMA 2 for commercial use.
Llama 2、私たちのオープンソースの大規模言語モデルの次世代
これは短いものになりますが、Metaは新しいバージョンのLLaMAをリリースします。このバージョンはLLaMA 2として知られ、研究および商業利用の両方で無料です。これはMetaとMicrosoftの共同リリースです。
Microsoftは、サードパーティのLLMをすべて独自のプラットフォームでSaaSとして保持し、商業提供として独占したいと考えているようです。今では、OpenAIとLLaMAの両方がMicrosoftの提供物の一部となります。
新機能は何ですか?
事前学習済みモデルと会話用に微調整されたバージョンのモデルの重みと起動コードを含めています
これにより、重みを取得して独自のモデルを構築するために4chanに行く必要がなくなります。アーキテクチャとモデルの重みは、商業目的で無料で使用できます。
- 「メタのLlama 2の力を明らかにする:創発型AIの飛躍?」
- 「オムニスピーチは、次世代のAI音声アルゴリズムにより、自動車、モバイル、消費者、およびIoTの顧客により良いサービスを提供するために、ケイデンス・テンシリカ・オーディオ・ソフトウェア・パートナーとなりました」
- 「ユネスコ、AIチップの埋め込みに関するプライバシー懸念を指摘」
このモデルは3つのバージョンで提供されます —
- LLaMA-2–7B
- LLaMA-2–13B
- LLaMA-2–70B
これらのモデルはFoundationモデルおよび関連するCHATモデルとしてリリースされます。そのため、合計6か月がリリースされます。
最も小さい7Bと13Bは、現代の一般的なGPUに収まるはずですが、より大きな70BはA100に収まるはずです。
- コンテキストの長さはデフォルトで4096ですが、増やすこともできます。
- モデルは2兆個のトークンでトレーニングされています。
- 7Bと13Bのアーキテクチャは古い兄弟と似ていますが、70Bは新しいリリースです。
- モデルはチャットのユースケース向けに微調整されており、10万サンプルと100万の人間の好みを使用して教師ありの微調整が行われています。
ベンチマーク:
このモデルは、ほとんどのオープンソースモデルと比べて同等のパフォーマンスを発揮するはずです。特に、Falcon-40B(現在の王者)と比較して、このモデルはすべてのタスクで大幅に優れたパフォーマンスを発揮します。
標準テストの一連のテスト
人間の評価者による評価…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles