「GoogleのRealLife AIモデルは魔法のような感じです」

「GoogleのRealLife AIモデルが魅せる魔法のような世界」

私たちの生活の物語を再定義する

Source: Author with Dalle-3

私があなたにお見せするものは前例のないものであり、まるで魔法のような感じがします。

Google ResearchはCornell大学との共同研究により、驚くべき結果をもたらす画像のインペインティングやアウトペインティングモデルであるRealFillを発表しました。

このモデルは、一連の画像を参照して、対象の画像の欠損部分を参照元に基づいて埋めることができます。

しかし、それはどういう意味ですか?

このモデルは、いくつかの画像の参照を使用して、参照を尊重しながら(インペインティング)または拡張しながら(アウトペインティング)埋めることができます。

このモデルは、参照が他のカメラ角度や照明条件であっても、それらの画像の主要な特徴を抽出し、それらを新しい画像に適用することができます。

これにより、完璧だけど切り取られた画像がどのようなものであるかを想像する必要はありません。

今では、単にそれを要求するだけです。

しかし、彼らが実際にこの魔法のようなモデルをどのように作成したかについて、詳細に調べてみましょう。

この記事は、私の無料週刊ニュースレターTheTechOasisで数日前に最初に公開されました。

AIの熱狂的な世界に最新情報を得ながら、行動を起こすことにインスピレーションを感じるか、少なくとも私たちの前に待ち受けている未来に備えるために、これはあなたにとって有益な情報です。

🏝以下に購読🏝して、同僚の中でAIリーダーになり、VoAGIを含む他のプラットフォームにはないコンテンツを受け取りましょう:

購読 | TheTechOasis

AIの最先端に追いつくためのニュースレター

thetechoasis.beehiiv.com

21世紀のミケランジェロ

最先端のGenerative AIモデルであるRealLifeも拡散モデルと同様です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

AIがUPSのパッケージ窃盗を監視しています

大手物流会社のUPSを含む他の企業も、玄関脇で盗難被害を減らすためのテクノロジーを導入し始めています

AI研究

マイクロソフトの研究者が提案するTaskWeaver:LLMを活用した自律エージェントの構築のためのコード優先の機械学習フレームワーク

大規模言語モデル(LLMs)は、印象的な自然言語生成および解釈能力を示しています。これらのモデルの例には、GPT、Claude、Pa...

AI研究

「NTUシンガポールの研究者たちは、テキストから3D生成のための新しいプラグアンドプレイなリファインメントAIメソッドであるIT3Dを提案しています」

テキストから画像への領域で注目すべき進歩があり、研究コミュニティ内で3D生成への拡大に対する熱意の急増が起きています。...

データサイエンス

スタンフォード大学とUTオースティンの研究者は、Contrastive Preference Learning (CPL)を提案します:RLHFのためのRL-Freeな方法であり、任意のMDPsとオフポリシーのデータと一緒に動作します

モデルがパフォーマンスを向上させるにつれて、人間の好みと大規模事前トレーニング済みモデルの一致は、研究の中で注目を集...

機械学習

費用効率の高いGPT NeoXおよびPythiaモデルの訓練における節約と正確性:AWS Trainiumの活用

大規模言語モデル(またはLLMs)は、日々の会話のトピックとなっていますその迅速な採用は、1億人のユーザーに到達するまでに...

AI研究

研究者たちは、新しい量子光源を開発しました

その装置は単一光子のストリームを放出し、光量子コンピュータの基盤となる可能性があります