『SDXL 1.0の内部:Stability AI 新しいテキストから画像へのスーパーモデル』

SDXL 1.0の内部:Stability AI

新しいリリースは、以前のバージョンよりも大幅に改善され、最新のモデルと一致しています。

画像クレジット:Stability AI

最近、AIに特化した教育ニュースレターを開始しました。すでに16万人以上の購読者がいます。TheSequenceは、5分で読めるMLに特化したニュースレターで、ハイプやニュースなどは一切なく、機械学習のプロジェクト、研究論文、概念について最新情報をお届けします。ぜひ以下から購読して試してみてください:

TheSequence | Jesus Rodriguez | Substack

機械学習、人工知能、データの最新動向を把握するための最高の情報源…

thesequence.substack.com

Stability AIは、Stable Diffusionファミリーのモデルのリリースにより、テキストから画像への革命の中心にありました。最近の数ヶ月間、3D分類、制御可能な画像編集、画像パーソナライズ、合成データの増強、グラフィカルユーザーインターフェースのプロトタイピングなど、テキストから画像へのモデルに関連する研究領域での画期的な進展が目覚ましく見られました。

これらの進展の一部を取り入れることで、Stabilityは徐々にStable Diffusionを改善してきました。この作業の最新の成果は、SDXLのリリースであり、テキストから画像の合成のために設計された非常に高度な潜在的拡散モデルです。このリリースにより、SDXLはStability AIの最新のテキストから画像生成モデルとなりました。

SDXLは、ClipDrop、GitHub、またはStability AIプラットフォームを介して利用できます。

詳細について見ていきましょう。

SDXLアーキテクチャ

以前のStable Diffusionのバージョンとは異なり、SDXLは大幅にパラメータを増やしたUNetバックボーンを採用しています。これは、より多くのアテンションブロックと大きなクロスアテンションコンテキストのためです。また、2つ目のテキストエンコーダを含めることで可能になりました。新しい調整スキームが導入され、SDXLは複数のアスペクト比でトレーニングされます。生成されたサンプルの視覚的な忠実度をさらに向上させるために、後処理の画像から画像への技術を利用したリファイメントモデルが導入されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「サティスファイラボのCEO兼共同創設者、ドニー・ホワイト- インタビューシリーズ」

2016年に設立されたSatisfi Labsは、会話型AI企業のリーディングカンパニーです早期の成功は、ニューヨーク・メッツ、メイシ...