Learn more about Search Results A - Page 131

フリーユーについて紹介します:追加のトレーニングや微調整なしで生成品質を向上させる新しいAIテクニック

確率的拡散モデルは、画像生成モデルの最新のカテゴリであり、特にコンピュータビジョンに関連するタスクにおいて研究の重要な焦点となっています。確率的拡散モデルは、Variational Autoencoder(VAE)、Generative Adversarial Networks(GAN)、およびベクトル量子化アプローチなど、他の画像生成モデルのクラスとは異なる新しい生成パラダイムを導入しています。これらのモデルは、潜在空間をマッピングするために固定マルコフ連鎖を使用し、データセット内の潜在的な構造的複雑さを捉える複雑なマッピングを可能にします。最近では、高い詳細レベルから生成される例の多様性までを含む印象的な生成能力により、画像合成、画像編集、画像から画像への変換、テキストからビデオへの変換など、さまざまなコンピュータビジョンの応用で突破的な進展が生まれています。 確率的拡散モデルは、拡散プロセスとノイズ除去プロセスの2つの主要なコンポーネントで構成されています。拡散プロセスでは、ガウスノイズが段階的に入力データに組み込まれ、徐々に純粋なガウスノイズに変換されます。対照的に、ノイズ除去プロセスは、学習された逆拡散操作のシーケンスを使用して、ノイズのある状態から元の入力データを復元することを目指します。通常、各ノイズ除去ステップごとにノイズの取り除きを予測するために、U-Netが使用されます。既存の研究は、主にダウンストリームの応用で事前学習された拡散U-Netの使用に焦点を当てており、拡散U-Netの内部特性の限られた探求を行っています。 S-Labと南洋理工大学の合同研究は、拡散モデルの従来の応用からの脱却を図り、拡散U-Netのノイズ除去プロセスにおける効果を調査しています。ノイズ除去プロセスのさらなる理解を得るため、研究者たちは、拡散モデルの生成プロセスを観察するためにフーリエドメインへのパラダイムシフトを導入しています。これは比較的未開拓の研究領域です。 上の図は、最上段における進行性のノイズ除去プロセスを示し、次に示される2つの行は、各ステップごとに対応する逆フーリエ変換後の低周波数および高周波数空間ドメイン情報を示しています。この図からは、低周波成分の漸進的な変調が示され、変調は緩やかな率で行われていることがわかります。一方、高周波成分は、ノイズ除去プロセス全体を通じてより顕著なダイナミクスを示しています。これらの結果は、直感的に説明することができます。低周波成分は、画像のグローバルな構造と特性を表しており、グローバルなレイアウトや滑らかな色を含んでいます。これらの成分に大きな変更を加えることは、画像の本質を根本的に変える可能性があるため、ノイズ除去プロセスでは一般的には適していません。一方、高周波成分は、エッジやテクスチャなどの画像の急速な変化を捉え、ノイズに非常に敏感です。ノイズ除去プロセスでは、これらの複雑なディテールを保持しながらノイズを除去する必要があります。 ノイズ除去時の低周波成分と高周波成分に関するこれらの観察を考慮すると、調査は拡散フレームワーク内のU-Netアーキテクチャの具体的な貢献を特定するために広がります。U-Netデコーダの各段階では、スキップコネクションとバックボーンからのスキップフィーチャーが組み合わされます。研究は、U-Netの主要なバックボーンがノイズ除去において重要な役割を果たしている一方、スキップコネクションはデコーダモジュールに高周波フィーチャーを導入し、微細なセマンティック情報の回復に役立っていることを明らかにしました。ただし、この高周波フィーチャーの伝播は、推論フェーズにおいてバックボーンの固有のノイズ除去能力を損なう可能性があり、異常な画像の詳細の生成につながることがあります(図1の最上段に示されています)。 この発見を踏まえ、研究者らは追加の計算コストの要求やトレーニング・ファインチューニングの必要性を伴わずに生成されたサンプルの品質を向上させる「FreeU」と呼ばれる新しいアプローチを提案しています。以下に、そのフレームワークの概要を報告します。 推論フェーズにおいて、U-Netアーキテクチャの主要なバックボーンとスキップ接続からの特徴の寄与のバランスを取るために、2つの専門的な変調因子が導入されます。最初の変数である「バックボーン特徴因子」は、主要なバックボーンの特徴マップを増幅させるために設計され、ノイズ除去プロセスを強化します。しかし、バックボーン特徴のスケーリング因子を含めることは、著しい改善をもたらす一方で、時折、望ましくないテクスチャのオーバースムージングを引き起こすことが観察されます。この懸念に対処するために、2つ目の因子である「スキップ特徴のスケーリング因子」が導入され、テクスチャのオーバースムージングの問題を軽減します。 FreeUフレームワークは、テキストから画像生成やテキストから動画生成などのアプリケーションを含む既存のディフュージョンモデルとシームレスに統合する柔軟性を示します。Stable Diffusion、DreamBooth、ReVersion、ModelScope、およびRerenderなどの基礎モデルを使用し、この手法の包括的な実験評価がベンチマーク比較において行われます。FreeUが推論フェーズで適用されると、これらのモデルは生成された出力の品質の noticeable な向上を示します。以下の図で示される視覚的な表現は、FreeUが生成された画像の細かいディテールと全体的なビジュアルの忠実度を著しく向上させる効果を証明しています。 これは、追加のトレーニングやファインチューニングを必要とせずに生成モデルの出力品質を向上させる新しいAIテクニックであるFreeUの概要でした。興味があり、さらに詳しく知りたい場合は、以下の引用リンクを参照してください。

会社の文書から洞察を抽出するために、ビジネスユーザーにAmazon SageMaker Canvas Generative AIを活用する力を与えましょう

企業は、機械学習(ML)の潜在能力を利用して複雑な問題を解決し、成果を向上させることを目指していますこれまでは、MLモデルの構築と展開には、MLモデルの調整や運用パイプラインの維持など、高度な技術とコーディングのスキルが必要でした2021年の導入以来、Amazon SageMaker Canvasは、ビジネスアナリストがビルド、展開を行うことができるようになりました

「Amazon Kendraを使用した知的にDrupalコンテンツを検索する」

「Amazon Kendra(アマゾン ケンドラ)は、機械学習(ML)によって動作するインテリジェントな検索サービスですAmazon Kendraは、さまざまなコンテンツリポジトリから簡単にコンテンツを集約し、中央のインデックスに格納しますこれにより、企業のデータ全体を迅速に検索し、最も正確な回答を見つけることができますDrupalはコンテンツ管理ソフトウェアです多くの場所で利用されています...」

「Intuitivoは、AWS InferentiaとPyTorchを使用して、AI/MLのコストを節約しながら、より高いスループットを実現します」

「これは、インテュイティボの創設者兼ディレクターであるホセ・ベニテスと、インフラストラクチャの責任者であるマティアス・ポンションによるゲスト投稿ですインテュイティボは、小売業の革新を牽引するクラウドベースのAIと機械学習(AI/ML)トランザクション処理システムでショッピングを革命化していますこの画期的な技術により、数百万の自律型購買ポイント(A-POPs)を運営することが可能になります...」

「NASAが宇宙探査用に3Dプリントでロケットノズルを製造」

アメリカ航空宇宙局は、より多くの貨物を搭載できるアルミニウム製のロケットエンジンノズルを3Dプリント技術で作成しましたこれにより深宇宙探査が可能となります

AI「ブレイクスルー」:ニューラルネットが人間と同様の言語の一般化能力を持つ

「ニューラルネットワークを用いた人工知能は、人間の知能の重要な側面である新しい言葉を素早く取り入れる点で、ChatGPTを上回ります」

「AIが歴史学者たちに過去をより良く理解する手助けをしている方法」

明日の歴史家たちはコンピューターサイエンスを利用して、何世紀も前の人々がどのように生活していたかを分析しています

AIツールが超新星を発見します

国際的な研究チームは、超新星を発見・検証することができる人工知能ベースのシステムを開発しました

Apple AirTagsは失われたスーツケースを追跡できますが、ストーキングに対する警告は遅いです

「ノーザンイースタン大学の研究者による研究によると、iPhoneユーザーへの未知のAirTagとの近距離通知は適切なタイミングで行われず、回避することができることがわかりました」

「ESAのセンチネルAPIに深く潜入」

ヨーロッパ宇宙機関は、さまざまな種類のリモートセンシングを活用して、地球観測を支援するコペルニクスプログラムの一環として、センチネルミッションを実施しています

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us