「Nous-Hermes-Llama2-70bを紹介します:30万以上の命令にファインチューニングされた最先端の言語モデル」

Introducing Nous-Hermes-Llama2-70b a cutting-edge language model fine-tuned on over 300,000 commands.

ハグフェイス・トランスフォーマーは、Pythonで非常に人気のあるライブラリであり、さまざまな自然言語処理タスクに非常に役立つ事前学習済みモデルを提供しています。以前はPyTorchのみをサポートしていましたが、現在はTensorflowもサポートしています。Nous-Hermes-Llama2-70bは、数十万の命令を使用するNLP言語モデルです。このモデルは、モデルのトレーニング中に深刻な変更がないように、古いヘルメスモデルと同じデータセットを使用し、プロセスがさらにスムーズになるようにしています。このモデルにはまだいくつかの欠点があり、幻覚率が低く、OpenAIの検閲がないということです。

モデルのトレーニングは、非常に高いデータ量とスタイルを持つ大規模なデータセットで行われました。データはさまざまなソースから収集され、1つのデータセットに統合されたため、処理されたデータセットには多様な知識があります。データセットはTeknium、Karan4D、Emozilla、Huemin Art、Pygmalion AIなどのさまざまなソースからデータを収集しました。このモデルはアルパカモデルを使用してトレーニングされています。研究チームは、アルパカの評価を行うために、自己指示評価データセットからの入力に対して人間の評価を行いました。研究者はこの評価セットを収集し、ほとんどすべてをカバーする多様なユーザ志向の指示をカバーしています。

研究者はまた、実行されたこのモデルにもプロンプトエンジニアが利益を得ることができると述べています。研究者は、上記の資産を公開することで、学術コミュニティが指示に従う言語モデルに関する制御科学的研究を実施し、最終的にはこのモデル内の既存の欠陥に対処する新しい技術を生み出すことができると信じています。アルパカのインタラクティブなデモの展開には、有害なコンテンツをより広く普及させ、スパムの可能性を低下させるなどの潜在的なリスクがあります。NLPにおけるスパム検出技術もこのモデルで重要な役割を果たします。研究者は、これらの緩和策を達成できると理解しています。モデルの重みを公開するか、ユーザが自分の指示に従ってモデルをトレーニングすることによって。

このプロジェクトの将来の計画には、高品質のデータを反復し、低品質のデータを削除するための技術を適用することも含まれます。研究者はまた、アルパカをより厳密に評価する必要があります。さらに、より生成的な情報を収集できると期待されるHELMモデルから始める予定です。研究者はまた、アルパカのリスクを研究し、その安全性をさらに向上させることを目指します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「力強いコネクティビティ:IoTにおけるエッジコンピューティングの復興」

エッジコンピューティングとIoTがリアルタイムの効率化、帯域幅の最適化、およびイノベーションのために結集します課題はまだ...

AI研究

ジェン AI for the Genome LLM は COVID バリアントの特徴を予測します

広く高く評価されている大規模な言語モデルであるGenSLMsは、COVID-19の原因であるSARS-CoV-2の現実世界の変異体に酷似した遺...

人工知能

ChatGPTで説得力を高めましょう

このChatGPTのプロンプトを使って、Robert Cialdiniの書籍「Influence」で説明されている強力な心理学の原理を直接ビジネスに...

データサイエンス

「AI戦略にデータ管理を実装する方法」

データはAI戦略の核ですデータの品質、データの統合、データのガバナンスは、データを最も効果的に扱うための3つの主要な要素...

機械学習

ヴェクタラは、AI言語モデルの「幻覚」をベンチマーク化し、対処するための画期的なオープンソースモデルを立ち上げます

急速に進化するGenerative AI(GenAI)領域での責任追及を促進する前例のない取り組みとして、Vectaraはオープンソースの幻覚...

データサイエンス

なぜディープラーニングは常に配列データ上で行われるのか?新しいAI研究は、データからファンクタまでを一つとして扱う「スペースファンクタ」を紹介しています

暗黙のニューラル表現(INR)またはニューラルフィールドは、3D座標を3D空間の色と密度の値にマッピングすることによって、3D...