簡単なアプリの統合に最適な安定した拡散APIのトップ5

「使いやすく安定した拡散APIのトップ5─アプリ統合に最適!」

イントロダクション

APIは人工知能の時代における解決策であり、AIモデルをソフトウェアやアプリケーションに統合する際の高い計算要件を管理する企業にとって重要な課題です。その解決策として、Application Programming Interfaces(API)が存在します。APIはメンテナンスの手間を省き、ビジネスロジックとユーザーエクスペリエンスに集中できるようにしてくれます。つまり、誰でもこれらのAPIを活用してアプリを構築し、商品化できます。本記事では、画像生成に焦点を当てた一連のGenerative AIモデルであるStable Diffusion APIsについて詳しく説明します。

まずは非常に効率的かつ効果的なオプションであるSegmind APIについて見ていきましょう。これらのAPIは、開発者、デザイナー、クリエイターが視覚コンテンツの生成に取り組む方法を革新しました。トップ5のStable Diffusion APIsを探求し、その特徴、使用用途、価格などをハイライトします。

学習目標

  • Stable Diffusionモデルに関する洞察を得る。
  • Stable Diffusionモデルの基礎を理解する。それには、その応用も含まれます。
  • 現代のソフトウェア開発におけるAPIの理解。
  • APIがソフトウェアおよびアプリケーションの開発を簡素化する際に果たす重要な役割の探求。

この記事はData Science Blogathonの一環として公開されました。

Stable Diffusionモデルの理解

Stable Diffusionモデルとは何ですか?

Stable Diffusionモデルは、高品質な画像の生成に焦点を当てた生成型AIモデルの一つです。これらのモデルは、様々な応用においてリアルで高解像度の画像を生成するように設計されています。これらのモデルは、画像合成、スタイル変換、データ拡張などのタスクに役立つ安定性と信頼性を備えています。

Stable Diffusionモデルは、ノイズを画像に徐々に追加していき、複雑で統一された出力に進化させる拡散プロセスを使用して画像を生成します。このプロセスにより、生成される画像は高品質で細部にわたる細かいディテールを持つことが保証されます。

APIとは何ですか?

API(アプリケーションプログラミングインターフェース)とは、1つのソフトウェアアプリケーションが他のアプリケーション、サービス、またはプラットフォームの機能やデータを相互作用させて使用できるようにするための規則やプロトコルのセットです。APIはソフトウェア間の統合を可能にする中間者として機能します。

ソフトウェア開発において、APIは開発者がクラウドサービス、データベース、またはAIモデルなどのソースから関数、サービス、またはデータにアクセスする手段を提供します。これにより、開発が簡素化され、機能豊かなアプリケーションの作成が加速されます。

APIは、RESTful API、gRPC API、WebSocket APIなどの形式で提供されることがありますが、それぞれが特定のユースケースに合わせてカスタマイズされています。APIは、外部サービスや機能のパワーを利用しながら、開発者が自身のコアアプリケーションロジックに集中することを可能にする現代のソフトウェアにおいて重要な役割を果たします。

トップ5のStable Diffusion APIs

まずはユーザーフレンドリーなSegmind APIから始めて、リストにあるトップのStable Diffusion APIsを見てみましょう。

1. Segmind Stable Diffusion APIs

リストのトップには、使いやすさとセットアップの簡便さで知られるSegmind APIがあります。PostmanのようなStandard APIツールの使用経験がある場合、新たに何かを学ぶ必要はほとんどありません。以下では、簡単にその方法を説明します。SegmindとPostmanの使用方法についての詳細なアプローチについては、https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/を参照してください。

SegmindのGenAI APIは、さまざまな目的、機能、メリットを提供しています。その中には、eコマース、ファッション、DvArchのようなアーキテクチャ、アニメーション、背景除去などでの画像認識が含まれます。Segmind AIモデルは、APIおよびウェブサイトのプレイグラウンドを介してhttps://www.segmind.com/modelsで利用可能です。

なぜ Segmind の API なのか?

Segmind がリストのトップに入る理由はたくさんあります。

  • スピード: Segmind は開発者が最速のサーバーレス安定拡散 API にアクセスできるようにしています。
  • 手頃な価格: Segmind の最適化により、API コールごとに最もコスト効果の高い推論を得ることができます。
  • 使いやすさ: ワンクリックで高性能な API をシームレスに統合し、簡単にスケーリングすることができます。
  • スケール: Segmind は需要に応じて自動的にスケールアップします。API コールのみが料金対象となります。

Segmind API プレイグラウンドでデモ

API プレイグラウンドを使用すれば、数秒でモデルを簡単に利用できます。API プレイグラウンドの動作をデモするために、新しいパワフルな安定拡散モデル「Dreamshaper SDXL」を使用します。数分で設定できるアカウントが必要です。サインアップするために https://www.segmind.com/ にアクセスしてください。サインアップ後、モデルのページに移動し、「Dreamshaper SDXL」という新リリースを検索します。または、このリンクを使用します https://www.segmind.com/models/sdxl1.0-dreamshaper。モデルをクリックすると、プレイグラウンドが表示されます。プレイグラウンドのほかに、以下のスクリーンショットに示すような API コールのインタフェースも使用できます。

上記の画像を試すには、次のプロンプトを使用します:

シネマティックポートレートの披露:おせっかいネコ 1.25 が宇宙服を着て無限の悲しみを持ちながら宇宙を眺める、サイバーパンク 2077 の街の背景、ジョン・ヴィルヘルムの 2D 傑作、おせっかい 1.2、サイバーパンク 1.4、写真のようなリアル、オクタンレンダリング、HDR、ネオン、レンズフレア、最高の品質 1.9、アクティブな非対称ポーズ、アクション満載 1.8、ArtStation で話題、8K、35mm の写真、フィルム、ボケ、プロフェッショナル、4K、高精細。

上記のアプローチは、ウェブサイト上で直接利用できるプレイグラウンドの使用方法です。利用可能なオプションのもう1つは、API です。これは Segmind の強力なオプションです。API コールを使用してアプリを構築し、Segmind モデルを楽しむことができます。

Segmind API コールの使用

API コールを使用すると、これらの大きくて高価なモデルのホスティングの必要性がなくなります。サーバーのメンテナンスやホスティングについて気にする必要はありません。Postman の使用など、API の基本的な知識が必要です。全体のプロセスは通常の API コールと同じです。ウェブアプリに JavaScript を使用する場合、以下は Dreamshaper SDXL に対して POST リクエストを行うためのスクリプトです。これにより jpeg 画像が返されます。

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# リクエストペイロードdata = {  "prompt": "シネマティックなサイバーパンクのポートレート(グランピー・キャット:1.25)が宇宙服で無限の悲しみを持ちながら宇宙を眺めている、サイバーパンク 2077 の街のバックグラウンド、ジョン・ヴィルヘルムによる 2D 傑作、「グランピー:1.2」、「サイバーパンク:1.4」、写真のようにリアルな、オクタンレンダリング、HDR、ネオン、レンズフレア、「最高の品質:1.9」、アクティブな非対称ポーズ、「アクション満載:1.8」、ArtStation で話題、8K、35mm の写真、フィルム、ボケ、プロフェッショナル、4K、高精細",  "negative_prompt": "描画、絵画、クレヨン、スケッチ、グラファイト、印象派、ノイズ、ぼかし、柔らかさ、変形、醜い、[変形 | 変形]、下手な:間違った解剖学、[余分 | 欠損 | 浮遊 | 切断]された手足、(変異した手と指)、ぼかし",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmindは、使いやすさとアクセシビリティのために、すべてのモデルが個別のドキュメントとしてAPI呼び出しスクリプトをページに持っています。必要なのは、PostmanからPOSTリクエストを作成するだけです。Pythonで開発していると仮定すると、以下に示すPythonのスクリプトがあります:

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Request payloaddata = {  "prompt": "シネマチックな肖像画でサイバーパンク(Grumpy Cat:1.25)を宇宙服で眺めながら絶え間ない悲しみを抱いて宇宙を見つめる、サイバーパンク2077の都市の背景、John Wilhelmによる2Dの傑作(grumpy:1.2)、(サイバーパンク:1.4)、写真リアル、Octane Render、HDR、ネオン、レンズフレア、(最高品質:1.9)、アクティブな非対称のポーズ、(アクション満載:1.8)、アートステーションでのトレンド、8K、35mm写真、フィルム、ボケ、プロフェッショナル、4K、高精細",  "negative_prompt": "絵画、クレヨン、スケッチ、グラフィット、印象派、ノイズ、ぼやけ、柔らかい、歪んだ、醜い、[歪んだ|変形した]、下手な絵、[悪い:間違った]解剖学、[余分|欠落|浮遊|切断]肢体、(変異した手と指)、ぼやけた",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

必要なのは、データ内のプロンプトを自分のものに変更するだけで、得られる応答はjpeg形式の生成された画像です。詳細な手順については、この記事を参照してください:https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/。または、ドキュメンテーションやGitHubリポジトリをご覧になってさらに情報を入手できます。リンクは記事の最後にまとめられています。次に、他のSD APIプロバイダーについて簡単に見ていきましょう。

2. Stability AI API – オープンソースの生成AI

オープンソースの生成人工知能のリーダーであるStability AIは、インフラと研究の進歩に専念しています。彼らのオープンソースの理念は、言語、コード、音声、映像、3Dコンテンツ、デザイン、バイオテックをサポートしています。これにより、AIのポテンシャルを活用した人類を助けることを目指しています。

Stability AI APIは、認証、クレジット、API呼び出しに柔軟なアプローチを提供しています。ユーザーはAPIキーを取得するためにアカウントを作成する必要があります。Stability APIを使用するにはクレジットが必要であり、新規ユーザーは登録時に25クレジットを無料で受け取ります。

API呼び出しの使用

Stability AIは、より一般的なRESTに加えて、gRPC APIも提供しているため、初心者には少し複雑です。技術的なガイドについては、GitHubをチェックすることができます:https://github.com/Stability-AI/。すべてのAPI呼び出しを提供するドキュメントを確認できますが、テキストから画像を生成するためには、以下のPythonのスクリプトのような構造になっています。

import base64import osimport requestsengine_id = "stable-diffusion-xl-1024-v1-0"api_host = os.getenv('API_HOST', 'https://api.stability.ai')api_key = os.getenv("STABILITY_API_KEY")if api_key is None:    raise Exception("Missing Stability API key.")response = requests.post(    f"{api_host}/v1/generation/{engine_id}/text-to-image",    headers={        "Content-Type": "application/json",        "Accept": "application/json",        "Authorization": f"Bearer {api_key}"    },    json={        "text_prompts": [            {                "text": "崖の上の灯台"            }        ],        "cfg_scale": 7,        "height": 1024,        "width": 1024,        "samples": 1,        "steps": 30,    },)if response.status_code != 200:    raise Exception("Non-200 response: " + str(response.text))data = response.json()for i, image in enumerate(data["artifacts"]):    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:        f.write(base64.b64decode(image["base64"]))

他のプログラミング言語を使用する開発者向けに、TypescriptとGoのスクリプトがあります。詳細については、ドキュメントをご確認ください。では、次のAPIをご覧ください。

3. Hotpot.aiの安定拡散API-あなたのニーズに合わせたもの

Hotpot.aiの安定拡散APIは、多様な要件に対応するための複数のオプションを提供する他のAPIの1つです。企業および消費者向けに独自の最適化が施され、カスタマイズ可能な安定拡散モデルを提供しています。登録する必要なく画像を生成することができます。私たちは、前回のプロンプトの最初の文を使用して彼らのAIアート生成器を使用して画像を生成します。

プロンプト:

サイバーパンクと未来的な宇宙探査の要素を融合した作品を作成してください。

「スタイル」パラメータを簡単に使用して画像を調整することができます。異なるスタイルに変更すると、以下の画像が表示されます。

料金: APIの料金は、月間のボリューム、サブスクリプションプラン、共同マーケティングディスカウントなどの要素に依存します。無制限のパッケージを提供する取引には注意が必要です。それらは信頼性とレイテンシに問題がある可能性があります。Hotpot.aiはスケーラビリティを確保し、低レイテンシと高い信頼性を維持しながら数百万の画像生成リクエストを処理しています。

APIの利用方法: APIアクセスは、安定拡散オンラインエディタを使用することで簡単に行えます。これにより、APIと同じ結果が得られます。主な違いは速度で、APIユーザーはよりパワフルなプライベートサーバーにアクセスしてより迅速な画像生成が可能です。さらに、Hotpot.aiは最新の安定拡散バージョンに追随し、商用目的での安定拡散XLの統合を提供しています。

HotpotのAPIコールスクリプトを見てみましょう。Hotpot.aiは安定拡散APIを予算、標準、プレミアムの3つのバージョンで提供しています。APIをPythonで使用するには、まず「request」をインストールする必要があります。

!pip3 install requestsimport requestsheaders = {  'Authorization': 'API_KEY_HERE',}# 変換したい画像の完全なファイルパスに変更してくださいbody = {  'image': open('/full/path/to/image.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# 結果の画像を保存したい完全なファイルパスに変更してくださいwith open('/full/path/to/image-nobg.jpg', 'wb') as file:  file.write(response.content)

PHPを使用している場合でも問題ありません。

<?php$ch = curl_init();// 変換したい画像の完全なファイルパスに変更してください$body = [  'image' => new CurlFile('/full/path/to/image.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_HERE');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// 結果の画像を保存したい完全なファイルパスに変更してくださいfile_put_contents('/full/path/to/image-nobg.jpg', $response);

GitHubから詳細を確認する際には、こちらを参照してください。

4. ZYLA安定拡散API-画像生成の再定義

ZYLAの安定拡散APIは、最先端の安定拡散v2.1モデルを活用して高品質の画像を生成します。このAPIは、高度な画像生成機能、スケーラビリティ、ユーザーフレンドリーなインターフェースを提供します。開発者、デザイナー、コンテンツクリエーターは、感動的でリアルな画像で自分のプロジェクトを向上させることができます。ZylaはAPIのウェブストアのようなものです。私たちは安定拡散APIに焦点を当てます。

ZYLA SD APIの注目される使用例

グラフィックデザインと広告: ウェブサイト、ソーシャルメディア、印刷広告の目を引くグラフィックを作成するのに最適です。

バーチャルリアリティと拡張現実: VRおよびARアプリケーションで視覚的な忠実度を高めます。

コンテンツ作成とメディア制作: 映画製作者、ゲーム開発者、アニメーションスタジオが魅力的なコンテンツを制作するのをサポートします。

Eコマースと商品可視化: リアルな商品画像でショッピング体験を向上させます。

芸術的な探求と創造的な表現: 創造性や芸術的な探求を刺激します。

画像編集と強化: 高度なツールを備えた画像編集者に力を与えます。

ほとんどのAPIには7日間の無料トライアルがあります。登録して、自分のニーズに合うか確認することができます。

AI Image Generator APIはSegmind AIとしてPostmanをサポートしています。登録後、個人用のAPIアクセスキーが提供されます。これはベアラートークンをAuthorizationヘッダーに含めることでAI Image Generator API REST APIと認証するために使用されます。Postmanのヘッダー変数は

Authorization

APIにアクセスするために登録する必要があります。登録後、[必須]で「Your API Access Key」としてBearer access_keyを設定します。

Bearer access_key

ZYLAはAPIのためのウェブストアのようなものであり、SD APIはそのコレクションの一部に過ぎません。

5. Getimg.ai API

このAPIを使用して最新のStable Diffusionベースのモデルを使用して画像を生成および編集できます。テキストから画像、ControlNet、インペイント、アップスケーリングなど、画像生成パイプラインでこのAPIを使用することができます。

コーディングを非常に簡潔にします。以下は、cURLを使用してテキストから画像生成のためにStable Diffusion APIにPOSTリクエストを行う方法の例です:

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"a photo of an astronaut riding a horse on Mars"}'

上記のプロンプトをプレイグラウンドで使用してモデルを試すことができます。以下のサンプルは一度に4つの画像を生成します。これはストック写真の生成に便利です。

プロンプトをカスタマイズして、要件に基づいて異なる画像を生成することができます。

さらに、getimg.aiではサイズ、ステップ、パイプラインに基づいたさまざまな価格オプションが提供されています。たとえば、1024×1024ピクセルと30ステップのStable Diffusion XLは画像1枚あたり$0.00944です。

このAPIに関する詳細情報、ユースケース、価格については、getimg.aiのウェブサイトで確認できます。画像生成と編集に提供される機能とモデルを探索することもできます。APIを使用するためには、サインアップしてAPIキーを取得し、リクエストを認証する必要があります。

結論

画像生成は急速に進化しており、Stable Diffusion APIは最先端に位置しています。開発者、デザイナー、コンテンツクリエイターは現在、多くの選択肢を持っています。これらのAPIは高度な機能、スケーラビリティ、多くのユースケースを提供しており、現代のAIの風景において欠かせないツールです。これらのAPIを活用してプロジェクトを変革し、切り込み画像生成技術の力を享受しましょう。

重要なポイント

  • Stable Diffusion APIはAIの開発にシームレスなアプローチを提供し、開発者がGPUの保守に時間を割かずにAI製品の構築に集中できるようにします。
  • 多くのStable Diffusion APIはStable Diffusion Online Editorsなどのツールを介してユーザーフレンドリーなアクセスを提供し、APIと同様の結果をより高速に提供します。
  • Stability AI APIはオープンソースの理念を採用し、さまざまなドメインで最先端のAI技術に対して開かれたアクセスを開発者に提供しています。

よくある質問

  • https://www.segmind.com/
  • https://www.segmind.com/models
  • https://www.segmind.com/models/sdxl1.0-dreamshaper
  • https://platform.stability.ai/docs/getting-started
  • https://platform.stability.ai/docs/api-reference
  • https://hotpot.ai/stable-diffusion-api
  • https://hotpot.ai/art-generator?s=stable-diffusion-api
  • https://zylalabs.com/api-marketplace/tag/stable+diffusion
  • https://stablediffusionapi.com/
  • https://getimg.ai/tools/api

この記事に表示されるメディアはAnalytics Vidhyaの所有物ではなく、著者の裁量で使用されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...