「Nous-Hermes-Llama2-70bを紹介します:30万以上の命令にファインチューニングされた最先端の言語モデル」

Introducing Nous-Hermes-Llama2-70b a cutting-edge language model fine-tuned on over 300,000 commands.

ハグフェイス・トランスフォーマーは、Pythonで非常に人気のあるライブラリであり、さまざまな自然言語処理タスクに非常に役立つ事前学習済みモデルを提供しています。以前はPyTorchのみをサポートしていましたが、現在はTensorflowもサポートしています。Nous-Hermes-Llama2-70bは、数十万の命令を使用するNLP言語モデルです。このモデルは、モデルのトレーニング中に深刻な変更がないように、古いヘルメスモデルと同じデータセットを使用し、プロセスがさらにスムーズになるようにしています。このモデルにはまだいくつかの欠点があり、幻覚率が低く、OpenAIの検閲がないということです。

モデルのトレーニングは、非常に高いデータ量とスタイルを持つ大規模なデータセットで行われました。データはさまざまなソースから収集され、1つのデータセットに統合されたため、処理されたデータセットには多様な知識があります。データセットはTeknium、Karan4D、Emozilla、Huemin Art、Pygmalion AIなどのさまざまなソースからデータを収集しました。このモデルはアルパカモデルを使用してトレーニングされています。研究チームは、アルパカの評価を行うために、自己指示評価データセットからの入力に対して人間の評価を行いました。研究者はこの評価セットを収集し、ほとんどすべてをカバーする多様なユーザ志向の指示をカバーしています。

研究者はまた、実行されたこのモデルにもプロンプトエンジニアが利益を得ることができると述べています。研究者は、上記の資産を公開することで、学術コミュニティが指示に従う言語モデルに関する制御科学的研究を実施し、最終的にはこのモデル内の既存の欠陥に対処する新しい技術を生み出すことができると信じています。アルパカのインタラクティブなデモの展開には、有害なコンテンツをより広く普及させ、スパムの可能性を低下させるなどの潜在的なリスクがあります。NLPにおけるスパム検出技術もこのモデルで重要な役割を果たします。研究者は、これらの緩和策を達成できると理解しています。モデルの重みを公開するか、ユーザが自分の指示に従ってモデルをトレーニングすることによって。

このプロジェクトの将来の計画には、高品質のデータを反復し、低品質のデータを削除するための技術を適用することも含まれます。研究者はまた、アルパカをより厳密に評価する必要があります。さらに、より生成的な情報を収集できると期待されるHELMモデルから始める予定です。研究者はまた、アルパカのリスクを研究し、その安全性をさらに向上させることを目指します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「ChatGPTを使用してAI幻覚を回避する方法」

「AI幻覚」は、ChatGPTの文脈でしばしば言及されますこの記事では、AI幻覚を100%完全に排除する方法を説明しています

機械学習

一緒にAIを学びましょう−Towards AIコミュニティニュースレター#5

おはようございます、AI愛好家の皆さん!今週のポッドキャストのエピソードは必聴で、これまでの24エピソードの中でも一番優...

AIニュース

「IIT卒業生のAIによるカバーレターが皆を爆笑させる」

事件の風刺的な展開の中で、あるIIT(インド工科大学)の卒業生が人工知能を活用してカバーレターを作成しようとした結果、大...

データサイエンス

スコア! チームNVIDIAが推薦システムでトロフィーを獲得しました

5人の機械学習の専門家が4つの大陸に分散し、最先端のレコメンデーションシステムを構築するための激しい競争で3つのタスク全...

人工知能

LLM SaaSのためのFastAPIテンプレート パート1 — Authとファイルのアップロード

最近、FastAPIはPythonバックエンド開発者コミュニティで注目を集めていますそのシンプルさ、非同期性、ネイティブのSwagger ...

AIニュース

「AnthropicがClaude 2を発表:コーディングを革新する次世代AIチャットプログラム」

人工知能スタートアップのAnthropicは、テックジャイアントのGoogleによるバックアップを受けて、人気のあるチャットプログラ...