自動小売りチェックアウトは、ラベルのない農産物をどのように認識するのか? PseudoAugmentコンピュータビジョンアプローチとの出会い

自動小売りチェックアウトは、ラベルのない農産物の認識方法とPseudoAugmentコンピュータビジョンアプローチの出会い

機械学習とディープラーニングの技術の進歩により、さまざまな次元の自動化が増えています。自動化により、特に小売業において、日常生活の様々なルーチン的な側面での人間の介入の必要性が徐々に減少しています。

これらは、自然資源の追跡や環境の持続可能性にも貢献しています。自動化システムは、在庫管理、需要予測、物流調整の向上により、サプライチェーンを最適化するのに役立ちます。しかし、自動化が困難で複雑な場合もあります。バーコードのない製品の識別はその一例です。

自動精算ステーションで消費者に適切に請求するためには、重さのあるオブジェクトを識別する能力が必要です。このようなシステムは、様々な種類の包装されていない生鮮食品、穀物、その他の商品を識別できなければなりません。一般的に、多くの小売店では、顧客は製品コードを覚え、部門で商品を計量して果物や野菜の種類を識別する必要があります。

この問題を解決するために、Skoltechと他の機関の研究者がスーパーマーケットで重量物を識別する新しい方法を考案しました。研究者たちは、このプロセスを支援するためにコンピュータビジョンを使用しました。このアプローチにより、新しい品種が導入されてもニューラルネットワークのトレーニングを高速化することができます。

研究者たちは、この研究を支援するためにさまざまなタイプの画像を収集しました。収集した画像は、庭園、地元の食料品店、研究室の設定で撮影されました。クラスごとに1000枚の自然画像を撮り、合計で5000枚の自然画像を使用しました。彼らはさらに、多くのオブジェクトがトップビューで表示されたトップビューコンテナ画像のタイプの画像を使用しました。クラスごとに70個のトップビュー画像を使用し、平均して1枚の画像あたり7.1個のオブジェクトが含まれていました。さまざまな画像や背景を組み合わせ、さまざまな変換を適用し、トレーニング画像の数よりも多くのトリミングオブジェクトを生成しました。

研究者たちはまた、画像を増強することで、検出品質の劣化がPseudoAugmentを使用しない場合よりも低くなるようにしました。

研究チームは、以前のプロセスにはいくつかの制限があると述べました。スーパーマーケットには視覚的に似ている果物や野菜が多くあり、新しい種類が頻繁に出現するため、クラシックなコンピュータビジョンシステムは新しい品種が納品されるたびに再トレーニングする必要があります。また、多くのデータを収集して手動でラベル付けする必要があるため、時間がかかります。

このアプローチの正確性とパフォーマンスをチェックするために、研究者は5つの異なる種類の果物を分類し、自然なトレーニング写真の数が50未満の場合、デフォルトのパイプラインの出力は基本的に推測に過ぎなかったことがわかりました。彼らはこのアプローチの利点は、元のトレーニング画像が250以下の場合に見られると強調しました。研究者たちはさらに、このアプローチの正確性を果物の分類問題でテストし、自然なトレーニング画像がない場合でも98.3%の正確性に達することができることを観察しました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

クロスヘアに捧げられた ジェネレーティブAI:CISOたちが戦うサイバーセキュリティ

ChatGPTと大規模な言語モデル(LLM)は、生成型AIが多くのビジネスプロセスにどのように影響を与えるかの初期の兆候です

機械学習

「これらの完全自動の深層学習モデルは、スマートフォンの統合を使用して、猫の苦痛指標スケール(FGS)を使用した痛み予測に使用できます」

人工知能(AI)の能力は、医療、金融、教育など、あらゆる業界に広がっています。医学や獣医学の分野では、適切な治療を施す...

AIテクノロジー

『思考の整理、早くて遅い+AI』

「人間の脳には、悪いニュースを優先する仕組みが備わっています」- ダニエル・カーネマン『思考の整理術』は、心理学者でノ...

データサイエンス

物議を醸している:GrokがOpenAIのコードを訓練に使用

Elon Muskの最新の事業は、生成AIベースのチャットボットGrokです。しかし、OpenAIのコードが訓練に使用されているという告発...

データサイエンス

自然言語処理のタクソノミー

「異なる研究分野と最近の自然言語処理(NLP)の進展の概要」

機械学習

医療画像AIがより簡単になりました:NVIDIAがMONAIをホステッドクラウドサービスとして提供

本日、NVIDIAは医療画像AIのためのクラウドサービスを立ち上げました。これにより、完全に管理され、クラウドベースのAPIを通...