Search Results リポジトリ

「RunPodを使用した生成的LLMsの実行 | サーバーレスプラットフォーム」

イントロダクションサーバーレスは、クラウドコンピューティングにおける画期的な戦略として浮上しています。開発者がアプリケーションの作成に完全に集中できる一方、基盤となるインフラストラクチャはクラウドプロバイダーが管理します。Generative AI Large Language Modelsは、これらの言語モデルが使用する高いGPU VRAMのため、ほとんどの開発者がローカルで実行できないため、Serverless GPUsの成長を後押ししています。RunPodは、リモートGPUサービスで人気が高まっているプラットフォームの1つです。RunPodは、GPUインスタンス、Serverless GPUs、APIエンドポイントなどのさまざまなコンピューティングサービスを提供することで、大規模な言語モデルを使用したアプリケーションの構築およびテストに強力なGPUへのアクセスを提供します。手頃な価格とさまざまなGPUの可能性があるため、リソース集約型の大規模言語モデルの実行には、RunPodでLLMsを学習してください。学習目標サーバーレスの概念と、LLMsで作業する開発者にとってなぜ役立つのかを学ぶ大規模言語モデルを実行するための高いGPU VRAMの必要性を理解するクラウドでGPUインスタンスを作成して言語モデルを実行する方法を学ぶ LLMのサイズに基づいてGPU VRAMを割り当てる方法を学ぶこの記事は、Data Science Blogathonの一環として公開されました。サーバーレスとは何ですか？サーバーレスは、クラウドプラットフォームのサービス/メソッドであり、開発とアプリケーションの展開に必要なインフラストラクチャをオンデマンドで提供します。サーバーレスでは、アプリケーションの開発に集中し、クラウドプロバイダーに基盤の管理を任せることができます。AWS、Azure、GCPなどの多くのクラウドプラットフォームがこれらのサービスを提供しています。近年、サーバーレスGPUが人気を集めています。サーバーレスGPUは、メモリが不足している場合にクラウド上でGPUの計算能力を借りることです。大規模な言語モデルの導入以来、これらのサーバーレスプラットフォームは次々と台頭し、他のプラットフォームよりも優れたGPUサービスを提供しています。RunPodはそのようなサービスの1つです。 RunPodについて RunPodは、GPUインスタンス、Serverless…

Amazon SageMakerのマルチモデルエンドポイントを使用して、TorchServeを使ってGPU上で複数の生成AIモデルを実行し、推論コストを最大75%節約できます

最近、生成AIアプリケーションは広範な注目と想像力を引きつけています顧客はGPU上で生成AIモデルを展開したいと思っていますが、同時にコストにも気を使っていますSageMaker MMEはGPUインスタンスをサポートしており、このようなタイプのアプリケーションには最適なオプションです本日は、TorchServeがSageMaker MMEをサポートすることをお知らせしますこの新しいモデルサーバーサポートにより、TorchServeの顧客が最も馴染みのあるサービングスタックを使用しながら、MMEのすべての利点を活用することができますこの記事では、Stable DiffusionやSegment Anything Modelなどの生成AIモデルをTorchServeを使用してSageMaker MME上でホストし、アーティストやコンテンツクリエーターが作品をより速く開発し、イテレーションするための言語による編集ソリューションの構築方法を示します

「Amazon SageMaker JumpStartでのテキスト生成のために、Llama 2を微調整する」

「本日は、Amazon SageMaker JumpStartを使用して、MetaによってLlama 2モデルを微調整する機能を発表できることを喜んでお知らせしますLlama 2ファミリーの大規模言語モデル（LLM）は、事前学習および微調整された生成テキストモデルのコレクションで、7億から700億のパラメータのスケールで提供されていますLlama-2-chatと呼ばれる微調整されたLLMは、対話の使用事例に最適化されています」

「Amazon Kendraを使用して、Adobe Experience Managerのコンテンツを賢く検索する」

この投稿では、Amazon Kendra AEMコネクタを設定してコンテンツをインデックス化し、AEMのアセットとページを検索する方法を紹介しますコネクタはまた、各ドキュメントのアクセス制御リスト（ACL）情報も取り込みますACL情報は、ユーザーがアクセス権を持っているものに絞り込まれた検索結果を表示するために使用されます

「Amazon SageMaker JumpStartを使用して、Generative AIとRAGを活用して安全なエンタープライズアプリケーションを構築する」

この投稿では、AWS Amplifyを使用してセキュアなエンタープライズアプリケーションを構築し、Amazon SageMaker JumpStart基盤モデル、Amazon SageMakerエンドポイント、およびAmazon OpenSearch Serviceを呼び出して、テキストからテキストまたはテキストから画像への変換、およびRetrieval Augmented Generation（RAG）の作成方法を説明しますこの投稿を参考にして、AWSサービスを使用してジェネレーティブAI領域のセキュアなエンタープライズアプリケーションを構築するために利用できます

迷路の作成

ウォール-Eプロジェクトのために迷路マップを作成している間にインスピレーションを受け、このチュートリアルに従って、グラフ理論を使って迷路をアルゴリズム的に生成する方法を探索してください

大規模言語モデルのコード解読：Databricksが教えてくれたこと

「ファインチューニング、フラッシュアテンション、LoRa、AliBi、PEFTなどの技術を使用して、カスタムモデルを開発することにより、自分自身のエンドツーエンドのプロダクションレディなLLMワークフローの構築を学びましょう」

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて – インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にするプラットフォームを開発者に提供していますこれにより、新世代の自律型ファイナンスへの道が開かれ、これまでになかった製品やサービスが実現されますこのプラットフォームは、生の取引ストリームをコンテキスト化された構造化情報に変換するために、データを組み合わせています」

「生成AIを通じて脆弱性を明らかにする」

この記事では、コードスキャンについて学び、MuleSoftのAPIでセキュリティに関連するパラメータの露出を報告する方法について詳しく説明します

自己対戦を通じて単純なゲームをマスターするエージェントのトレーニング

「完全情報ゲームで優れるために必要なすべてがゲームのルールにすべて見えるというのはすごいことですね残念ながら、私のような凡人には、ゲームのルールを読むことさえ…」

Learn more about Search Results リポジトリ - Page 43