「GoogleのDeblur AI:画像をシャープにする」

Google's Deblur AI Sharpening Images

ぼやけた画像にさようなら。Googleの新しい技術があなたの携帯のカメラの真のポテンシャルを引き出します。

Image by Author

はじめに

私たちの進化し続けるデジタル時代において、写真を通じて瞬間を捉え、共有することが私たちの生活の一部となっています。ぼやけた画像ができた場合の失望感は大きいものです。大切な家族の写真、息をのむような風景、特別な場面のスナップショットなど、ぼやけた画像は視覚的なインパクトを減らし、私たちが望む明瞭さを奪ってしまいます。

しかし、心配しないでください。Googleの新しい手法を使用することで、携帯電話から直接クリアな画像を撮影する方法が提供されます。現在のほとんどの携帯電話には複数のカメラが搭載されています。Googleは、2つの異なるカメラからの単一のキャプチャを使用し、学習可能なポストプロセッシングを利用してぼやけた画像を再焦点化します。広角(W)カメラと超広角(UW)カメラを同時に使用して同じシーンをキャプチャすることで、より鮮明な結果を得ることを目指しています。

アーキテクチャ

Image from Paper

DFNetモデルは、同じシーンの広角と超広角の撮影とそれらのフォーカスマップを入力として受け取ります。入力とターゲットのフォーカスマップは、元の画像と出力画像のぼやけ具合を表し、各ピクセルの値は対応する画像ピクセルのぼやけ具合に比例します。

超広角と超広角の画像は非常に異なるため、被写界深度、対称性、焦点距離、および色が異なります。これらの画像を組み合わせることは容易なタスクではありません。そのため、Googleはこれらの画像を繋ぎ合わせるための学習ベースの手法を導入しています。

モデルは広角画像をベース画像として、超広角画像を高周波詳細の参照として使用します。モデルは、提供されたフォーカスマップに従って、両方の画像をブレンドし、出力がぼやけた画像になるようにします。

テスト時には、対象のフォーカスマップを簡単に変更することで、必要に応じて画像の異なる部分をぼやけさせることができます。

Image from Paper

上記のように、完全にクリアな画像を生成するには、フォーカスマップをすべてゼロに設定することができます。これにより、モデルは画像のすべての部分をぼやけさせるようになります。他の場合では、テスト時に提供されたフォーカスマップに従って、画像の特定の部分をぼやけさせることができます。

結果

PSNRスコアが29.78、SSIMスコアが0.898となり、このポストプロセッシング手法は定性的および定量的な分析の両方で以前の手法を上回ります。

Image from Paper
Image from Paper

結果は、以前の手法とGoogleのDFNetとの比較で、DFNetがより鮮明さと詳細を備えた最先端の結果を示しています。

このモデルは、画像の再焦点化、被写界深度(DoF)制御と再レンダリング、およびぼやけ除去といった領域での潜在的な利用があります。

制約事項

複数のカメラが必要

このモデルは、高周波詳細の参照を提供する広角と超広角のカメラを使用しています。両方の画像は、シーンの異なる部分に焦点を当てた異なる被写界深度を持つ必要があります。同じカメラからキャプチャされた画像では、このような結果を再現することはできません。また、デュアルカメラの携帯電話に大きく依存しており、単一の画像入力では画像の修復はできません。

データセットの生成

広角および超広角で撮影された画像のデータセットは一般的に広く利用できません。また、実世界のシナリオにおけるノイズを再現することができる画像にガウシアンぼかしを追加して合成することも不可能です。ドメインギャップを減らすために、著者はこの手法のために100枚の画像スタックを撮影しました。

既存の手法への依存

データの前処理部分では、デフォーカスマップ、深度マップ、遮蔽マスクを生成するために前提となるオプティカルフローおよびステレオデプスアルゴリズムが必要です。この前処理では、重大なアーティファクトを生成することがあるため、出力画像の劣化が生じることがあります。

結論

ブラーをなくす。Googleの最新の画像復元技術により、ぼやけた画像に終止符を打つことができます。これがスマートフォンのカメラのAIに取り込まれれば、毎日完璧な写真が見られるようになるでしょう。

詳細な理解のためには、論文をお読みください。

論文: https://defocus-control.github.io/static/dc2_paper.pdf

この記事がお気に入りの場合、または機械学習や研究コミュニティの最新の進展についてもっと学びたい場合は、フォローしてください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「テーマパークのシミュレーション:Rを使って待ち時間を理解する」

長い列はいつも嫌なものです、特に宇宙を舞い上がるか、グレート・バリア・リーフを航行するために待っている時には夏休みが...

データサイエンス

GPT-4 新しいOpenAIモデル

近年、人工知能に基づく自然言語システムの開発は前例のない進歩を遂げています

データサイエンス

デジタルネイティブ(クラウドで生まれた人々)のデータストリーミングの現状

クラウドに生まれたデジタルネイティブを探索し、イノベーションと新しいビジネスモデルにApache Kafkaを活用し、トレンド、...

AI研究

トヨタのAIにより、電気自動車の設計がより迅速になりました

トヨタ研究所(TRI)は、車両設計の世界で発表を行いました。彼らは、画期的な生成型人工知能(AI)技術を発表し、電気自動車...

人工知能

AIを使用して画像をビデオに変換する(Runway 2 チュートリアル)

RunwayMLは、ユーザーが静止画像を数秒でビデオに変換することができるAIツールです

データサイエンス

デコード Transformersを平易な英語で説明します

コード、数学、またはキー、クエリ、値の言及なし