「Tiktokenを使用して、OpenAI APIのコストを簡単に見積もることができます」

Using Tiktoken, you can easily estimate the cost of the OpenAI API.

トークンをカウントして、OpenAI APIの使用で破産しないようにしましょう

新鮮なトークン!1キロあたり0.0015ドル!

私が知っている多くの人々は、OpenAIの大規模言語モデル(LLM)を使って遊びたいと思っています。しかし、LLMのホスティングは高価であり、そのため、OpenAIのアプリケーションプログラミングインターフェース(API)などの推論サービスは無料ではありません。しかし、推論コストがどれくらいかかるのかわからずに支払い情報を入力するのは少し抵抗があります。

通常、私は記事の解説にAPIのコストの指標を含めることで、読者が何を予想しているかを知り、推論のコストについて感覚を得ることができるようにしています。

この記事では、OpenAIの基礎モデルの推論コストを推定するために使用するtiktokenライブラリについて紹介します。

tiktokenとは何ですか?

tiktokenは、OpenAIが開発したオープンソースのバイトペアエンコーディング(BPE)トークナイザーで、彼らのLLMでテキストをトークン化するために使用されます。これにより、OpenAIのエンドポイントにコールを行う前にテキスト内にいくつのトークンがあるかを開発者が数えることができます。

したがって、OpenAI APIの使用に関連するコストを推定するのに役立ちます。なぜなら、そのコストはOpenAIの価格ページ[1]によって「1,000トークンの単位で請求されるからです。

GitHub — openai/tiktoken: tiktoken is a fast BPE tokeniser for use with OpenAI’s models.

tiktoken is a fast BPE tokeniser for use with OpenAI’s models. — GitHub — openai/tiktoken: tiktoken is a fast BPE…

github.com

トークンとトークナイズ

トークンはテキスト内の共通の文字列であり、トークナイズはテキスト文字列をトークンのリストに分割することです。トークンは単語に等しい場合もありますが、通常は複数のトークンで単語が構成されます。

自然言語処理(NLP)モデルはトークンで訓練され、それらの間の関係を理解します。したがって、入力テキストはNLPモデルが処理する前にトークナイズされます。

ただし、単語がどのようにトークナイズされるかは使用されるトークナイザーに依存します。

以下に、テキストをトークナイズする例を示します。

「アリスはオウムを飼っています。

アリスのペットはどんな動物ですか?」

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

このAI研究によって、写真-SLAMが発表されました:ポータブルデバイスでのリアルタイム写真写実的マッピングを向上させる

コンピュータビジョンとロボット工学において、カメラによる同時位置推定と地図作成(SLAM)は、自律システムが自ら環境をナ...

データサイエンス

AIが脳の液体の流れを示すのに役立つ

科学者たちのチームが、人間の脳の脳血管周りの流体の流れを定量化するために、人工知能に基づく速度測定を作成しました

機械学習

「GETMusicに会ってください:統一された表現と拡散フレームワークで、統一された表現と拡散フレームワークを使用して任意の音楽トラックを生成できます」

近年、機械学習モデルを用いた音楽生成において、大きな進展がありました。しかし、結果に対する効率と実質的な制御を達成す...

人工知能

「月光スタジオのAIパワード受付アバター、NANAに会いましょう」

エディター注:この投稿は、当社の週刊「In the NVIDIA Studio」シリーズの一環であり、注目のアーティストを紹介し、クリエ...

AIニュース

紙のような、バッテリー不要のAI対応センサーによる包括的な傷のモニタリング

バッテリー不要のホリスティックな傷モニタリングセンサーパッチは、人工知能を利用して、着用者の傷の治癒状態を15分以内に...

AI研究

「このAI研究は、深層学習と進化アルゴリズムを用いて、シリコンMach-Zehnderモジュレータの設計を革新します」

NetflixやIoTの人気や分散コンピューティングおよびストレージアーキテクチャへの移行により、ネットワークの伝送容量要件が...