「Cを使用してLLMsを最適化し、GPT、Lama、Whisperを自分のラップトップで実行する」

Optimize LLMs using C and run GPT, Lama, and Whisper on my laptop

この最初の記事では、Georgi Gerganovによって作成された素晴らしいテンソルライブラリggmlについて詳しく調査していきます。それはどのように機能するのでしょうか?テンソルの作成プロセスはどうなっていますか?いくつかの単純な例から始めることはできますか?

Image by Aryo Yarahmadi on Unsplash

目次

  1. 単純な数学関数の実装1.1 コンテキストの定義1.2 テンソルの初期化1.3 順方向計算と計算グラフ1.4 コンパイルと実行
  2. この最初のパートに関する最終的なコメント
  3. 執筆をサポートする

大規模な言語モデル(LLM)はどこでも話題となっています。新聞は新たな到来する世界を説明するために無数の言葉を費やし、「AIはついに到着した」と断言しています。LLMは私たちの生活に具体的な影響をもたらしていますが、私たちは冷静になり、状況全体を批判的に分析する必要があります。LLMのハイプは、いくつか年前に「データサイエンティスト」の仕事がハイプとなったのと同様です。2014年に博士課程を開始したとき、私はデータサイエンティストの求人ポジションの着実な増加を目の当たりにしましたが、ピークは2018年ごろでした。その当時、ニュースは再び「データサイエンティスト:100万ドルの職業」とか「21世紀の最もセクシーな仕事」と書いていました-これらのタイトルはLLMのものと似ているでしょうか?

一方で、LLMは素晴らしい技術であり、より一般的なAIフレームワークへの一歩です。これらのモデルはAIへのより深い旅への出発点であり、私はいつかほとんどのアプリやテクノロジーがこれらのモデルに依存すると確信しています。しかし、VoAGIでもよく見かけることですが、これらのモデルについての明確さが欠けていることがあります。そのパワーや素晴らしい成果に関係なく、これらのモデルは実行やトレーニングが容易ではありません。したがって、企業は戦略的なビジネス方向を決定する前に、LLMを非常によく知る必要があります。最も切実なポイントの1つは、これらのモデルが持つ巨大なメモリコスト、トレーニングに必要な大規模なインフラストラクチャ、および推論に必要な高コストなインフラストラクチャです。

基本的なLLMの構造であるトランスフォーマーを考えると、古典的なエンコーダーデコーダーの構造を認識できます。推論時には、デコーダーはインメモリメカニズムを持っている必要があります…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...