「合成イメージングがAIトレーニングの効率性を新たな基準に設定」

「合成イメージングがAIトレーニングの効率性を革新」

研究者たちは、大規模な設定で実施された実験において、合成画像のみで訓練されたモデルが、実際の画像で訓練されたモデルよりも優れていることを初めて示しました。 ¶ クレジット:Alex Shipps / MIT CSAIL、Midjourney AIイメージジェネレータ経由

マサチューセッツ工科大学(MIT)の研究者チームが示したところによれば、合成画像を用いて機械学習モデルを訓練することは、実際の画像を使用する従来の訓練方法よりも優れていることがわかりました。

この戦略は、「マルチポジティブ輪郭学習」として知られており、Stable Diffusionのようなテキストから画像への変換モデルを使用して、StableRepを用いて合成画像を生成します。

StableRepでは、生成モデル内の「ガイダンススケール」を調整し、合成画像の多様性と忠実度のバランスを取ることができます。

研究者たちはまた、言語の監督を追加したStableRep+を作成しました。彼らはStableRep+を2,000万枚の合成画像で訓練し、5000万枚の実際の画像で訓練されたCLIPモデルよりも効率的であることを確認しました。ただし、研究者たちは、テキストプロンプトの選択が完全にバイアスフリーではないことを認識しています。

MITのリージエ・ファンは、「最新のテキストから画像への変換モデルを使用することで、単一のテキスト入力から多様なビジュアルを得るために、過去に類を見ないほどの制御が可能になりました。これは、実世界の画像収集を超える効率性と多様性を持っています」と述べています。MITニュースからの引用 記事全文を見る

概要の著作権 © 2023 SmithBucklin、ワシントンD.C.、アメリカ

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「科学者がスーパーバグと戦うため、分子を死から甦らせる」

調査チームは、絶滅した人類の祖先から遺伝情報を採掘するために計算手法を使用し、新しい抗生物質の候補を特定しています

AI研究

「NYUとMeta AIの研究者は、ユーザーと展開されたモデルの間の自然な対話から学習し、追加の注釈なしで社会的な対話エージェントの改善を研究しています」

ヒューマンインプットは、社会的な対話モデルを改善するための重要な戦術です。ヒューマンフィードバックを用いた強化学習で...

データサイエンス

「数値処理者がクジラが奇妙な行動をしているかどうかを計算する」

研究者は、統計的な手法を用いて鯨の自然な行動と影響を受けた行動を区別しました

データサイエンス

ビッグデータアプリケーションのクラウドストレージコストの管理

増加し続けるデータ量への依存度の高まりにより、現代の企業は高容量かつ高スケーラビリティのあるデータストレージソリュー...

AI研究

「CMUとマックス・プランク研究所の研究者が、画期的なAI手法「WHAM」を発表:ビデオからの正確かつ効率的な3D人間動作推定」

3Dヒューマンモーション再構築は、三次元で人間の動きを正確にキャプチャしてモデル化する複雑なプロセスです。カメラが動い...

機械学習

「LLaSMと出会う:音声と言語の指示に従うクロスモーダルな対話能力を持つエンドツーエンドで訓練された大規模なマルチモーダル音声言語モデル」

音声はトーンなどの意味論的およびパラ言語的情報を含むため、書き込みよりも多くの情報を伝えます。さらに、話すことは人々...