「Tiktokenを使用して、OpenAI APIのコストを簡単に見積もることができます」

Using Tiktoken, you can easily estimate the cost of the OpenAI API.

トークンをカウントして、OpenAI APIの使用で破産しないようにしましょう

新鮮なトークン!1キロあたり0.0015ドル!

私が知っている多くの人々は、OpenAIの大規模言語モデル(LLM)を使って遊びたいと思っています。しかし、LLMのホスティングは高価であり、そのため、OpenAIのアプリケーションプログラミングインターフェース(API)などの推論サービスは無料ではありません。しかし、推論コストがどれくらいかかるのかわからずに支払い情報を入力するのは少し抵抗があります。

通常、私は記事の解説にAPIのコストの指標を含めることで、読者が何を予想しているかを知り、推論のコストについて感覚を得ることができるようにしています。

この記事では、OpenAIの基礎モデルの推論コストを推定するために使用するtiktokenライブラリについて紹介します。

tiktokenとは何ですか?

tiktokenは、OpenAIが開発したオープンソースのバイトペアエンコーディング(BPE)トークナイザーで、彼らのLLMでテキストをトークン化するために使用されます。これにより、OpenAIのエンドポイントにコールを行う前にテキスト内にいくつのトークンがあるかを開発者が数えることができます。

したがって、OpenAI APIの使用に関連するコストを推定するのに役立ちます。なぜなら、そのコストはOpenAIの価格ページ[1]によって「1,000トークンの単位で請求されるからです。

GitHub — openai/tiktoken: tiktoken is a fast BPE tokeniser for use with OpenAI’s models.

tiktoken is a fast BPE tokeniser for use with OpenAI’s models. — GitHub — openai/tiktoken: tiktoken is a fast BPE…

github.com

トークンとトークナイズ

トークンはテキスト内の共通の文字列であり、トークナイズはテキスト文字列をトークンのリストに分割することです。トークンは単語に等しい場合もありますが、通常は複数のトークンで単語が構成されます。

自然言語処理(NLP)モデルはトークンで訓練され、それらの間の関係を理解します。したがって、入力テキストはNLPモデルが処理する前にトークナイズされます。

ただし、単語がどのようにトークナイズされるかは使用されるトークナイザーに依存します。

以下に、テキストをトークナイズする例を示します。

「アリスはオウムを飼っています。

アリスのペットはどんな動物ですか?」

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「MozillaがFirefoxに偽レビューチェッカーAIツールを導入」

オンラインショッピングの広大な景色の中で、本物の製品レビューを捉えることはますます困難な課題となっています。消費者は...

コンピュータサイエンス

「UCサンディエゴのコンピュータサイエンティストが、毎年15億台の廃棄されたスマートフォンの問題に取り組む」

カリフォルニア大学サンディエゴ校のコンピュータ科学者は、無効化されたスマートフォンを再利用する方法を提案しました

機械学習

「Intuitivoは、AWS InferentiaとPyTorchを使用して、AI/MLのコストを節約しながら、より高いスループットを実現します」

「これは、インテュイティボの創設者兼ディレクターであるホセ・ベニテスと、インフラストラクチャの責任者であるマティアス...

機械学習

「ハリウッドの自宅:DragNUWAは、制御可能なビデオ生成を実現できるAIモデルです」

生成AIは、大規模な拡散モデルの成功的なリリースにより、過去2年間で大きな飛躍を遂げました。これらのモデルは、リアルな画...

コンピュータサイエンス

「サンドイッチされた半導体により、伸縮可能な統合エレクトロニクスが可能になるかもしれません」

国際研究チームは、統合電子機器に弾力性を提供するために、サンドイッチ状の半導体を開発しました

AIニュース

F.T.C.、AmazonをPrimeに加入させるためにユーザーをだますと非難

訴訟は、連邦取引委員会の委員長であるリナ・カーンが指揮する初めてのアマゾンに対する訴訟です