Learn more about Search Results P100 - Page 2
- You may be interested
- 「すべてのデータを理解する」
- 「FreedomGPT」という名称のAI技術をご紹...
- 「LangChainとGPT-3を使用して、ドキュメ...
- 「大規模なラスター人口データの探索」
- 「包括的な時系列探索的分析」
- スタンフォードの研究者たちは「CORNN」と...
- 「2023年の最高の人工知能AIベースのアー...
- 「思考伝搬:大規模言語モデルを用いた複...
- 「トランスフォーマーブロックは、効率を...
- 「NVIDIA CUDA Quantumによる研究者の進歩...
- 簡単なアプリの統合に最適な安定した拡散A...
- 「Hugging Face LLMツールの完全初心者ガ...
- 「マイクロソフトが7TBの『プロジェクト・...
- Python開発のための12のVSCodeのヒントと...
- 機械学習とは何か?メリットとトップMLaaS...
事例研究:Hugging Face InfinityとモダンなCPUを使用したミリ秒レイテンシー
はじめに 転移学習は、自然言語処理(NLP)から音声およびコンピュータビジョンのタスクまで、機械学習を新たな精度レベルに変えてきました。Hugging Faceでは、これらの新しい複雑なモデルと大規模なチェックポイントをできるだけ簡単にアクセス可能かつ利用可能にするために、努力して取り組んでいます。しかし、研究者やデータサイエンティストがTransformersの新しい世界に移行している一方で、これらの大規模で複雑なモデルを実稼働環境で大規模に展開することができる企業はほとんどありません。 主なボトルネックは、予測のレイテンシーであり、大規模な展開を実行するために高コストになり、リアルタイムのユースケースが実用的になりません。これを解決するには、どの機械学習エンジニアリングチームにとっても難しいエンジニアリング上の課題であり、ハードウェアまでモデルを最適化するための高度な技術の使用を必要とします。 Hugging Face Infinityでは、最も人気のあるTransformerモデルに対して、低レイテンシー、高スループット、ハードウェアアクセラレーションされた推論パイプラインを簡単に展開できるコンテナ化されたソリューションを提供しています。企業は、Transformersの精度と大容量展開に必要な効率性を、使いやすいパッケージで手に入れることができます。このブログ投稿では、最新世代のIntel Xeon CPU上で実行されるInfinityの詳細なパフォーマンス結果を共有したいと思います。 Hugging Face Infinityとは Hugging Face Infinityは、お客様が最新のTransformerモデルを最適化したエンドツーエンドの推論パイプラインを任意のインフラストラクチャ上で展開できるコンテナ化されたソリューションです。 Hugging Face Infinityには、2つの主要なサービスがあります: Infinityコンテナは、Dockerコンテナとして提供されるハードウェア最適化された推論ソリューションです。 Infinity Multiverseは、Hugging Face Transformerモデルをターゲットハードウェアに最適化するモデル最適化サービスです。Infinity MultiverseはInfinityコンテナと互換性があります。…
GPUを活用した特徴量エンジニアリングにおいてRAPIDS cuDFを使用する
Google Colabと統合し、データフレームの作成と特徴量エンジニアリングにおいて、cuDFにPandasを置き換えることでパフォーマンスを向上させる
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.