「Nous-Hermes-Llama2-70bを紹介します:30万以上の命令にファインチューニングされた最先端の言語モデル」

Introducing Nous-Hermes-Llama2-70b a cutting-edge language model fine-tuned on over 300,000 commands.

ハグフェイス・トランスフォーマーは、Pythonで非常に人気のあるライブラリであり、さまざまな自然言語処理タスクに非常に役立つ事前学習済みモデルを提供しています。以前はPyTorchのみをサポートしていましたが、現在はTensorflowもサポートしています。Nous-Hermes-Llama2-70bは、数十万の命令を使用するNLP言語モデルです。このモデルは、モデルのトレーニング中に深刻な変更がないように、古いヘルメスモデルと同じデータセットを使用し、プロセスがさらにスムーズになるようにしています。このモデルにはまだいくつかの欠点があり、幻覚率が低く、OpenAIの検閲がないということです。

モデルのトレーニングは、非常に高いデータ量とスタイルを持つ大規模なデータセットで行われました。データはさまざまなソースから収集され、1つのデータセットに統合されたため、処理されたデータセットには多様な知識があります。データセットはTeknium、Karan4D、Emozilla、Huemin Art、Pygmalion AIなどのさまざまなソースからデータを収集しました。このモデルはアルパカモデルを使用してトレーニングされています。研究チームは、アルパカの評価を行うために、自己指示評価データセットからの入力に対して人間の評価を行いました。研究者はこの評価セットを収集し、ほとんどすべてをカバーする多様なユーザ志向の指示をカバーしています。

研究者はまた、実行されたこのモデルにもプロンプトエンジニアが利益を得ることができると述べています。研究者は、上記の資産を公開することで、学術コミュニティが指示に従う言語モデルに関する制御科学的研究を実施し、最終的にはこのモデル内の既存の欠陥に対処する新しい技術を生み出すことができると信じています。アルパカのインタラクティブなデモの展開には、有害なコンテンツをより広く普及させ、スパムの可能性を低下させるなどの潜在的なリスクがあります。NLPにおけるスパム検出技術もこのモデルで重要な役割を果たします。研究者は、これらの緩和策を達成できると理解しています。モデルの重みを公開するか、ユーザが自分の指示に従ってモデルをトレーニングすることによって。

このプロジェクトの将来の計画には、高品質のデータを反復し、低品質のデータを削除するための技術を適用することも含まれます。研究者はまた、アルパカをより厳密に評価する必要があります。さらに、より生成的な情報を収集できると期待されるHELMモデルから始める予定です。研究者はまた、アルパカのリスクを研究し、その安全性をさらに向上させることを目指します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「生成AIの風景を探索する」

ジェネレーティブAIは、特にニューラルネットワークを用いて、与えられたデータセット内のパターンを解読するために、さまざ...

AI研究

Amazonの研究者たちが提案するディープラーニングのトレーニングのためのコンパイラには、3つの主な特徴があります- Syncfreeオプティマイザ、コンパイラキャッシュ、およびマルチスレッド実行

機械学習の最大の課題の1つは、ニューラルネットワークを効率的にトレーニング及び使用することです。トランスフォーマーモデ...

データサイエンス

Btech卒業後に何をすべきですか?

Btechの後に何をすべきですか?このよくある質問は、最終学年や最近卒業した学生にとって悩みの種です。多くの人々が従来のキ...

人工知能

ChatGPTから独自のプライベートなフランス語チューターを作成する方法

議論された外国語チューターのコードは、私のGitHubページの同梱リポジトリで見つけることができます非商業利用に限り、自由...

データサイエンス

FraudGPT AIを活用したサイバー犯罪ツールの驚異的な台頭

インターネットの暗く不気味な一角で、サイバー犯罪者たちは再び人工知能の力を利用して悪意ある目的を追求しています。悪名...

AIニュース

「ウェブパブリッシャーコントロールの最新情報」

「私たちはGoogle-Extendedを発表しますこれは、ウェブパブリッシャーが自分たちのサイトがBardとVertex AIの生成APIを改善す...