このAI研究は、事前のイメージングなしで物体のエッジを検出するためのノイズ耐性のある方法を開発しました
このAI研究は、ノイズに強い方法で物体のエッジを事前のイメージングなしで検出する技術を開発しました
コンピュータビジョンでの重要な関心は、堅牢で効率的なエッジ検出アルゴリズムの開発に集中しています。 従来の微分演算に基づく従来のエッジ検出アルゴリズムから、ニューラルネットワークに基づく最先端のエッジ検出アルゴリズムまで、エッジ検出アプローチはセキュリティ、環境感知、医療に大きく貢献しています。 画像処理手法はエッジ情報を回復するため、従来のエッジ抽出では、対象物の事前完全写真の入手可能性が必要です。 したがって、エッジ識別の成功は、入力画像の品質に依存します。 しかし、標準の光学撮影技術では、霧や濁った水、生体組織など複雑な環境設定での対象物のクリアな画像の取得は困難です。 特に光害のある場面では、最終画像のエッジ検出品質は損なわれる可能性があります。
インテリジェントコンピューティングで公開された研究では、エッジ感度のあるシングルピクセルイメージングが紹介されています。 この画期的な手法は、重度の光害などの変数により、標準の光学的手法による良い画像の取得が困難な場合でも、オブジェクトのエッジを適切に検出するのに特に有用です。
SIベースのエッジ検出アルゴリズムの実現可能性は最近確立されました。 予備イメージングやポストプロセッシングなしに、直接ノイズに強いエッジ感度単一ピクセルイメージング(ESI)を使用して高品質のエッジ抽出方法が提供されます。 ESIは、オブジェクトに慎重に作成された変調パターンを照明し、そのエッジを抽出します。 ハダマード単一ピクセルイメージング(HSI)では、対応するハダマード基底パターンのセットを単一のピクセルに投影してオブジェクトの完全な画像を生成します。 ESIは、二次微分作用素と畳み込むことにより、ハダマード基底パターンのマージンで変動変調パターンを取得します。 このアプローチにより、事前存在するイメージングは不要で、オブジェクトのエッジに対するエッジ感度の高いハダマードスペクトラを直接取得してエッジを検出します。 ESIは、エッジ検出を高速化し、信号対雑音比(SNR)を向上させるためにバイナリ変調パターンを使用します。
- 「生成AIからの社会的および倫理的リスクの評価」
- 研究者がCODES+ISSS最優秀論文賞を受賞しました
- スタンフォード、NVIDIA、およびUT Austinの研究者は、クロスエピソードカリキュラム(CEC)と呼ばれる新しい人工知能アルゴリズムを提案しましたこれにより、トランスフォーマーエージェントの学習効率と汎化能力が向上します
ESIよりも半分の変動パターンを使用してエッジを迅速に検出するSESIエッジ検出技術が開発されました。 結果として、SESIは半分の時間でエッジを検出することができ、SIベースのエッジ検出がより実用的になります。 ラプラシアンとガウシアンラプラシアン(LoG)は、一般的な二次微分作用素の例であり、ここでは大部分の議論を占めます。 理論的および実践的な評価の両方が、エッジ検出シミュレーションと実験の結果に与える影響を確認しています。 これらのテストでは、ESIとSESIは画像から鮮明なエッジを直接抽出することができることを示しています。
SIの形式での計算画像は、シーンの照明を特定の目標に合わせるために使用されます。 この研究では、照明パターンは特定のエッジ検出目的に合わせて作成されました。 エンドツーエンドで最適化された計算画像は、この研究と同様に特定の仕事(例えば、エッジ検出)のための照明パターンを作成するのに類似しています。 エッジ検出照明パターンは、決定論的かつ解釈可能な数学モデルを使用して構築されます。 対照的に、エンドツーエンドの最適化照明パターンは、通常、最適化を含むデータ駆動型人工知能を使用して想像されます。 エンドツーエンド最適化では、グローバル最適性を達成するための高い基準があります。 この研究では、代表的な二次微分作用素のペアによって生成される照明パターンに焦点を当てています。
従来のSIは、対象物の対応する変調基底パターンを投影してから、逆変換または圧縮センシング画像回復技術を使用して対象画像を再構築します。
研究者によって開発された変動パターンは、典型的なハダマードシングルピクセルイメージングパターンを使用して、二次微分作用素によって畳み込まれ、エッジ検出のために開発されました。 この微分エッジ検出手法のノイズ耐性は大幅に向上し、エッジの明確かつ正確な検出が可能になります。 特に感動的なのは、この手法のリアルタイムでのエッジ検出能力であり、移動するオブジェクトでもエッジを検出できることであり、見えないスペクトルでの盗聴セキュリティチェックに使用する可能性を示しています。 この研究では、新しい手法の1ラウンドバリアントも示しており、エッジ検出のための変調パターンをより少なく使用して検出時間を半分に削減します。 この単純化にもかかわらず、このシステムは以前に公開されたエッジ検出スキームよりも変調パターンが少なく、信号対雑音比が高いです。
新しい技術は、変動パターンを事前にコード化することで、「画像フリー」の形で即座の結果を提供することができるため、画像処理のさまざまなアプリケーションに適用することができます。 その結果、背景ノイズの干渉を少なくしたホモモーフィックフィルタリングや他の画像処理技術を組み合わせることができます。 将来の改良には、この研究で使用される照明パターンのエンドツーエンド最適化と最適化の探索が期待されています。
ラプラシアンとLoG演算子がESIスキームの耐久性にどのように影響するかが説明されました。シミュレーション研究によれば、ラプラシアンESIとLoG ESIはSNRに関して類似したノイズ耐性を持っていますが、ラプラシアンESIの方がエッジがより鮮明です。実験結果もシミュレーション結果と一致しました。一方、LoG ESIはより粗いエッジを作成しました。提案されたESIの手法は、オブジェクトのエッジ画像を取得するための代替手法を提供し、従来の画像処理技術がモジュレーションパターンに事前にコード化され、直接的な結果を提供することができるというアイデアが創造的なアイデアとして提供されています。この追加の次元は、事前にコード化されたモジュレーションパターンが周囲の環境の干渉やノイズに対して影響を受けないという点で重要です。事前にコード化することは、ホモモーフィックフィルタリングを含む高度な結果のために使用される可能性がある多くの画像処理技術の一つです。この研究で開発された光のパターンは、システム全体の最適化の出発点として微調整されて使用することができます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- シンガポール国立大学の研究者たちは、ピクセルベースと潜在ベースのVDMを結びつけたハイブリッド人工知能モデルであるShow-1を提案しますこれはテキストからビデオを生成するものです
- Amazonの研究者たちが提案するディープラーニングのトレーニングのためのコンパイラには、3つの主な特徴があります- Syncfreeオプティマイザ、コンパイラキャッシュ、およびマルチスレッド実行
- このAI研究は、FlashAttentionに基づいた新しい人工知能アプローチであるフラッシュデコーディングを紹介しますこれにより、長いコンテキストのLLM推論を最大8倍速く行うことができます
- このAI研究は、ロボット学習および具現化人工知能の研究のための包括的なソフトウェアプラットフォームとエコシステムであるRoboHiveを提案しています
- NVIDIAの研究者が「Retro 48B」を導入:前の指示調整よりも前にリトリーバルが行われた最大のLLM Pretrained
- SalesForce AI研究所によって開発されたProGen:人工知能を使用したタンパク質エンジニアリングの飛躍的進歩
- プリンストンの研究者が、構造化プルーニングを介した言語モデルの事前トレーニングの加速のためのシャアドLLaMAモデルを紹介します