自動小売りチェックアウトは、ラベルのない農産物をどのように認識するのか? PseudoAugmentコンピュータビジョンアプローチとの出会い

自動小売りチェックアウトは、ラベルのない農産物の認識方法とPseudoAugmentコンピュータビジョンアプローチの出会い

機械学習とディープラーニングの技術の進歩により、さまざまな次元の自動化が増えています。自動化により、特に小売業において、日常生活の様々なルーチン的な側面での人間の介入の必要性が徐々に減少しています。

これらは、自然資源の追跡や環境の持続可能性にも貢献しています。自動化システムは、在庫管理、需要予測、物流調整の向上により、サプライチェーンを最適化するのに役立ちます。しかし、自動化が困難で複雑な場合もあります。バーコードのない製品の識別はその一例です。

自動精算ステーションで消費者に適切に請求するためには、重さのあるオブジェクトを識別する能力が必要です。このようなシステムは、様々な種類の包装されていない生鮮食品、穀物、その他の商品を識別できなければなりません。一般的に、多くの小売店では、顧客は製品コードを覚え、部門で商品を計量して果物や野菜の種類を識別する必要があります。

この問題を解決するために、Skoltechと他の機関の研究者がスーパーマーケットで重量物を識別する新しい方法を考案しました。研究者たちは、このプロセスを支援するためにコンピュータビジョンを使用しました。このアプローチにより、新しい品種が導入されてもニューラルネットワークのトレーニングを高速化することができます。

研究者たちは、この研究を支援するためにさまざまなタイプの画像を収集しました。収集した画像は、庭園、地元の食料品店、研究室の設定で撮影されました。クラスごとに1000枚の自然画像を撮り、合計で5000枚の自然画像を使用しました。彼らはさらに、多くのオブジェクトがトップビューで表示されたトップビューコンテナ画像のタイプの画像を使用しました。クラスごとに70個のトップビュー画像を使用し、平均して1枚の画像あたり7.1個のオブジェクトが含まれていました。さまざまな画像や背景を組み合わせ、さまざまな変換を適用し、トレーニング画像の数よりも多くのトリミングオブジェクトを生成しました。

研究者たちはまた、画像を増強することで、検出品質の劣化がPseudoAugmentを使用しない場合よりも低くなるようにしました。

研究チームは、以前のプロセスにはいくつかの制限があると述べました。スーパーマーケットには視覚的に似ている果物や野菜が多くあり、新しい種類が頻繁に出現するため、クラシックなコンピュータビジョンシステムは新しい品種が納品されるたびに再トレーニングする必要があります。また、多くのデータを収集して手動でラベル付けする必要があるため、時間がかかります。

このアプローチの正確性とパフォーマンスをチェックするために、研究者は5つの異なる種類の果物を分類し、自然なトレーニング写真の数が50未満の場合、デフォルトのパイプラインの出力は基本的に推測に過ぎなかったことがわかりました。彼らはこのアプローチの利点は、元のトレーニング画像が250以下の場合に見られると強調しました。研究者たちはさらに、このアプローチの正確性を果物の分類問題でテストし、自然なトレーニング画像がない場合でも98.3%の正確性に達することができることを観察しました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

PatchTST 時系列予測における画期的な技術革新

トランスフォーマーベースのモデルは、自然言語処理の分野(BERTやGPTモデルなど)やコンピュータビジョンなど、多くの分野で...

データサイエンス

イノベーションを推進するための重要なツール:データレイクハウスにおけるジェネラティブAIの向上

LLMおよびジェネレーティブAIアプリの登場により、データは全エコシステムの中心的な要素となっています本記事では、データレ...

AIニュース

Googleの機能や製品をラボで試してください

Google の大胆で責任ある実験を最初に見て、それらの背後にいるチームにフィードバックを共有しましょう

AIニュース

「2023年のAI タイムライン」

はじめに 人工知能(AI)は、技術的な進歩が人間のつながりの本質と共鳴する形で私たちの日常生活と交差する魅力的な領域です...

AI研究

メタスの新しいテキストから画像へのモデル - CM3leon論文の説明

メタは最近、Stable-Diffusion [2]、Midjourney、またはDALLE [3]のような拡散に基づかない最新のテキストから画像へのモデル...

人工知能

「APIガバナンスによるAIインフラストラクチャのコスト削減」

APIガバナンスは、リソースの割り当てを最適化し、利用状況をモニタリングし、セキュリティを強化することによって、組織がAI...