効率的にオープンソースのLLMを提供する

効率的なオープンソースのLLM提供

Photo by Mariia Shalabaieva on Unsplash

この記事では、オープンソースのLLM(Language Model)を提供するための一般的な6つの方法を使用した個人的な経験を説明します:AWS Sage Maker、Hugging Face、Together.AI、VLLM、Petals.ml。

苦労…

自分自身でファインチューニングされたオープンソースのLLMを提供する苦労と栄光を感じたことがあるかもしれませんが、最終的にはコスト、推論時間、信頼性、技術的な課題のためにOpen AIやAnthropicに戻ることを決めました 🙁 A100 GPUを借りるのを諦めたこともあるかもしれません(多くのプロバイダーが2023年の終わりまで完全に予約済みです!)。そして、2段構造のA100サーバーボックスに10万ドルを投資する余裕もありません。それでも、夢を見ており、オープンソースを自分の解決策に適用したいと思っています。おそらく、会社はプライベートデータをOpen AIに送りたくないのか、非常に特定のタスクに適したファインチューニングモデルが必要なのかもしれません。この記事では、2023年にオープンソースのLLMを提供するための最も効果的な推論方法/プラットフォームを概説し、比較します。6つの方法を比較し、それぞれの使用場面について説明します。これらのソリューションのすべてを個人的に試してみ、その経験について詳しく説明します:AWS Sage Maker、Hugging Face Inferenceエンドポイント、Together.AI、VLLM、Petals.ml。全ての答えを持っているわけではありませんが、私の経験を詳しく紹介するためにこれらのプロバイダーとは金銭的な関係はありません。単に他の人のために私の経験を共有しています。あなたの経験について教えてください!

なぜオープンソースを選ぶのか?

オープンソースモデルには、制御、プライバシー、コスト削減などの数々の利点があります。たとえば、特定のユースケースに合わせて小さなオープンソースモデルをファインチューニングすることで、正確な結果と高速な推論時間を得ることができます。プライバシーの制御は、推論を独自のサーバーで行うことができることを意味します。一方、コスト削減は思っているよりもはるかに困難です。Open AIは規模の経済効果を持っており、競争力のある価格設定をしています。GPT-3.5 turboの価格モデルは非常に競合力があり、電気のコストと類似していることが示されています。それでも、コストを節約し、オープンソースモデルで優れた結果を得るための方法やテクニックがあります。たとえば、私のファインチューニングされたStable Beluga 2モデルは現在、GPT-3.5 Turboを大幅に上回り、私のアプリケーションではより安価です。ですので…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「2023年にデータサイエンスFAANGの仕事をゲットする方法は?」

データサイエンスは非常に求められる分野となり、FAANG(Facebook、Amazon、Apple、Netflix、Google)企業での就職は大きな成...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

人工知能

ギル・ジェロン、Orca SecurityのCEO&共同創設者-インタビューシリーズ

ギル・ゲロンは、オルカ・セキュリティのCEO兼共同設立者ですギルは20年以上にわたりサイバーセキュリティ製品をリードし、提...