「Tiktokenを使用して、OpenAI APIのコストを簡単に見積もることができます」

Using Tiktoken, you can easily estimate the cost of the OpenAI API.

トークンをカウントして、OpenAI APIの使用で破産しないようにしましょう

新鮮なトークン!1キロあたり0.0015ドル!

私が知っている多くの人々は、OpenAIの大規模言語モデル(LLM)を使って遊びたいと思っています。しかし、LLMのホスティングは高価であり、そのため、OpenAIのアプリケーションプログラミングインターフェース(API)などの推論サービスは無料ではありません。しかし、推論コストがどれくらいかかるのかわからずに支払い情報を入力するのは少し抵抗があります。

通常、私は記事の解説にAPIのコストの指標を含めることで、読者が何を予想しているかを知り、推論のコストについて感覚を得ることができるようにしています。

この記事では、OpenAIの基礎モデルの推論コストを推定するために使用するtiktokenライブラリについて紹介します。

tiktokenとは何ですか?

tiktokenは、OpenAIが開発したオープンソースのバイトペアエンコーディング(BPE)トークナイザーで、彼らのLLMでテキストをトークン化するために使用されます。これにより、OpenAIのエンドポイントにコールを行う前にテキスト内にいくつのトークンがあるかを開発者が数えることができます。

したがって、OpenAI APIの使用に関連するコストを推定するのに役立ちます。なぜなら、そのコストはOpenAIの価格ページ[1]によって「1,000トークンの単位で請求されるからです。

GitHub — openai/tiktoken: tiktoken is a fast BPE tokeniser for use with OpenAI’s models.

tiktoken is a fast BPE tokeniser for use with OpenAI’s models. — GitHub — openai/tiktoken: tiktoken is a fast BPE…

github.com

トークンとトークナイズ

トークンはテキスト内の共通の文字列であり、トークナイズはテキスト文字列をトークンのリストに分割することです。トークンは単語に等しい場合もありますが、通常は複数のトークンで単語が構成されます。

自然言語処理(NLP)モデルはトークンで訓練され、それらの間の関係を理解します。したがって、入力テキストはNLPモデルが処理する前にトークナイズされます。

ただし、単語がどのようにトークナイズされるかは使用されるトークナイザーに依存します。

以下に、テキストをトークナイズする例を示します。

「アリスはオウムを飼っています。

アリスのペットはどんな動物ですか?」

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「システムは光と電子を組み合わせて、より速く、より環境に優しいコンピューティングを実現します」

「Lightning(雷)」システムは、新しい抽象化を使用して、光子をコンピュータの電子部品に接続し、リアルタイムの機械学習推...

データサイエンス

「知識の回復が中心舞台に登場する」

消費者からビジネス展開への転換をするために、GenAIにはリトリーバルセントリックジェネレーション(RCG)を使用したモデル...

機械学習

AWSの知的ドキュメント処理を生成AIで強化する

「データの分類、抽出、分析は、大量の文書を扱う組織にとって困難な課題です従来の文書処理ソリューションは手作業が必要で...

人工知能

GPT4Allは、あなたのドキュメント用のローカルChatGPTであり、無料です!

あなたのラップトップにGPT4Allをインストールし、AIにあなた自身のドメイン知識(あなたのドキュメント)について尋ねる方法...

AI研究

ニューヨーク大学とMetaの研究者が、「Dobb-E」という家庭用ロボット操作のためのオープンソースかつ汎用フレームワークを紹介した

NYUとMetaの研究者チームは、DobbEという高度に適応性のあるシステムを開発し、家庭環境におけるロボットの操作学習の課題に...

AIニュース

「Amazon SageMakerは、個々のユーザーのためにAmazon SageMaker Studioのセットアップを簡素化します」

今日は、Amazon SageMakerの簡素化されたクイックセットアップエクスペリエンスの提供をお知らせいたしますこの新機能により...