「Nous-Hermes-Llama2-70bを紹介します:30万以上の命令にファインチューニングされた最先端の言語モデル」
Introducing Nous-Hermes-Llama2-70b a cutting-edge language model fine-tuned on over 300,000 commands.
ハグフェイス・トランスフォーマーは、Pythonで非常に人気のあるライブラリであり、さまざまな自然言語処理タスクに非常に役立つ事前学習済みモデルを提供しています。以前はPyTorchのみをサポートしていましたが、現在はTensorflowもサポートしています。Nous-Hermes-Llama2-70bは、数十万の命令を使用するNLP言語モデルです。このモデルは、モデルのトレーニング中に深刻な変更がないように、古いヘルメスモデルと同じデータセットを使用し、プロセスがさらにスムーズになるようにしています。このモデルにはまだいくつかの欠点があり、幻覚率が低く、OpenAIの検閲がないということです。
モデルのトレーニングは、非常に高いデータ量とスタイルを持つ大規模なデータセットで行われました。データはさまざまなソースから収集され、1つのデータセットに統合されたため、処理されたデータセットには多様な知識があります。データセットはTeknium、Karan4D、Emozilla、Huemin Art、Pygmalion AIなどのさまざまなソースからデータを収集しました。このモデルはアルパカモデルを使用してトレーニングされています。研究チームは、アルパカの評価を行うために、自己指示評価データセットからの入力に対して人間の評価を行いました。研究者はこの評価セットを収集し、ほとんどすべてをカバーする多様なユーザ志向の指示をカバーしています。
研究者はまた、実行されたこのモデルにもプロンプトエンジニアが利益を得ることができると述べています。研究者は、上記の資産を公開することで、学術コミュニティが指示に従う言語モデルに関する制御科学的研究を実施し、最終的にはこのモデル内の既存の欠陥に対処する新しい技術を生み出すことができると信じています。アルパカのインタラクティブなデモの展開には、有害なコンテンツをより広く普及させ、スパムの可能性を低下させるなどの潜在的なリスクがあります。NLPにおけるスパム検出技術もこのモデルで重要な役割を果たします。研究者は、これらの緩和策を達成できると理解しています。モデルの重みを公開するか、ユーザが自分の指示に従ってモデルをトレーニングすることによって。
このプロジェクトの将来の計画には、高品質のデータを反復し、低品質のデータを削除するための技術を適用することも含まれます。研究者はまた、アルパカをより厳密に評価する必要があります。さらに、より生成的な情報を収集できると期待されるHELMモデルから始める予定です。研究者はまた、アルパカのリスクを研究し、その安全性をさらに向上させることを目指します。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles