大規模な言語モデルを効率的に提供するためのフレームワーク

言語モデルの効率的な提供のためのフレームワーク

大規模言語モデルをOpenAI APIを使用するかのように無料で提供する方法

Austrian National Libraryによる写真(Unsplash)

はじめに

ここ数ヶ月、大規模言語モデルの使用について多くの関心が寄せられています。これは、解決が困難と思われるほとんどのユースケースに取り組む能力と、素晴らしい研究コミュニティのおかげです。

AIや機械学習モデルも、いかに強力であっても、本番環境に移行しなければステークホルダーがより良い意思決定をするのには役立ちません。

これらの大規模言語モデルを展開することは、展開チームが無能であるわけではなく、単にこの種のモデルの展開の複雑さのために、間違いなく最も困難なタスクの一つです。

これらのモデルの産業化プロセスをできるだけスムーズにするフレームワークがあれば素晴らしいですよね?

そこで、UCバークレーがApacheライセンスの下で開発したオープンソースライブラリであるvLLMライブラリが役立ちます。

vLLMの背後にある考え方は、大規模言語モデルのサービングと推論を、産業界と小規模研究チームの両方に手頃な価格で提供することです。

この非スポンサー(非プロモーション)のチュートリアルを完了すると、次のことができるようになります:

  • ワークスペースとGoogle ColabにvLLMをセットアップする
  • プロンプト上で大規模言語モデルのオフラインバッチ推論を実行する
  • Postmanおよびcurlコマンドを使用してモデルを提供するAPIサーバーを作成する

vLLM — なぜ気にすべきか?

実装に入る前に、vLLMのパフォーマンスをHuggingFace Transformers(HF)などの他のツールと比較して簡単に概観しましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「タンパク質設計の革命:ディープラーニングの改良により成功率が10倍に向上したこのAI研究」

タンパク質はほぼすべての疾患を統治するポリマー構造です。主な問題は、どのタンパク質がそれに対応するタンパク質ポリマー...

AI研究

UC BerkeleyとDeepmindの研究者は、SuccessVQAという成功検出の再構成を提案しましたこれは、Flamingoなどの事前学習済みVLMに適したものです

最高のパフォーマンス精度を達成するためには、トレーニング中にエージェントが正しいまたは望ましいトラック上にあるかどう...

データサイエンス

「PyTorchでのSoft Nearest Neighbor Lossの実装方法」

表現学習は、深層ニューラルネットワークによって与えられたデータセット内の最も顕著な特徴を学習するタスクです通常は教師...

機械学習

コンピュータビジョンの進歩:画像認識のためのディープラーニング

この記事では、コンピュータビジョンの進歩について詳しく学びますまた、画像認識のためのディープラーニングについても学び...

AI研究

2023年にフォローすべきトップ10のAIインフルエンサー

イントロダクション 先端技術と驚くべき可能性によって駆動される世界で、AIの絶えず進化する領域に遅れをとらないことは、ス...

人工知能

「目標をより早く達成するための25のChatGPTプロンプト」

「自分の目標を達成することに苦しんでいると感じたときはいつでも、この記事を読んでください... 効果があります」