メディアでのアルコール摂取の検出:CLIPのゼロショット学習とABIDLA2ディープラーニングの画像解析のパワーを評価する

アルコール摂取の検出:CLIPとABIDLA2の画像解析のパワーを評価する

アルコールは、広範な健康上の懸念事項であり、5.1%のグローバルな疾病負荷を占め、個人や経済に重大な負の影響を与えています。ソーシャルメディアから映画、広告、人気のある音楽まで、アルコール暴露はいたるところにあります。研究者は、アルコール関連のソーシャルメディア投稿への暴露と特に若者の間でのアルコール使用との関連性を示唆しています。研究者たちは、アルコール暴露を測定し分析するための革新的な手法を探求しています。アルコール飲料の画像からの識別に関して、Alcoholic Beverage Identification Deep Learning Algorithm (ABIDLA) のような教師あり深層学習モデルは有望でありますが、トレーニングには大量の手動注釈付きデータが必要です。

これに対するもう一つのアプローチは、Zero-Shot Learning (ZSL) を利用したContrastive Language-Image Pretraining (CLIP)モデルです。研究者たちは、ZSLモデルのパフォーマンスを、画像中のアルコール飲料を特定するために特別にトレーニングされた深層学習アルゴリズム(ABIDLA2)と比較しました。評価のために研究者によって使用されたテストデータセットは、ABIDLA2の論文で使用されているABD22で、8つの飲料カテゴリを含んでいます。評価のために各クラスごとに1762のテストセットがあり、均一な分布を維持しています。評価には、加重平均再現率(UAR)、F1スコア、クラスごとの再現率などのパフォーマンスメトリックが計算され、ABIDLA2とZSLの名前付きおよび記述的なフレーズの両方について比較されました。

研究者たちは、ZSLがいくつかのタスクでうまく機能する一方で、細かい分類には支援が必要であることがわかりました。ABIDLA2モデルは、特定の飲料カテゴリの識別においてZSLを上回りました。しかし、記述的なフレーズ(例:「これはビール瓶を持っている人の写真です」)を使用したZSLは、特定の飲料をより広範な飲料カテゴリ(ビール、ワイン、スピリッツ、その他、つまりタスク2)に分類する際には、ABIDLA2とほぼ同等のパフォーマンスを発揮し、アルコール含有量の有無を分類する際にはABIDLA2を上回りました。

彼らは、フレーズエンジニアリングがZSLのパフォーマンス向上に重要であること、特に「その他」クラスにおいては不可欠であることを特定しました。

この研究の主な強みの一つは、ZSLが追加のトレーニングデータと計算リソースを最小限に抑え、教師あり学習アルゴリズムと比較してコンピュータサイエンスの専門知識を少なく必要とすることです。特に2値分類が必要な場合、画像中のアルコール含有物を正確に特定するという研究の質問に対して、ZSLは正確に対応することができます。この研究の結果は、将来の研究が実際のデータセットにおいて、異なる人口や文化の画像を含む教師あり学習モデルの一般化能力をZSLと比較することを奨励しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Apache CassandraとApache Pulsarを使用した製品推薦エンジンの構築」

仮説上の請負業者がApache PulsarとApache Cassandraを使用してAIの加速化を行った方法この記事ではAI/MLへの道のりの重要な...

AIニュース

「AIを活用して国連の持続可能な開発目標に取り組む15のプロジェクト」

「Google.orgは、AIを活用して国連の持続可能な開発目標に進展をもたらすための15のプロジェクトを資金提供しています」

AIニュース

AWSを使用したジェネレーティブAIを使用したサーバーレスイメージ生成アプリケーション

このチュートリアルでは、Amazon Bedrockを使用してGoで画像生成ソリューションを構築し、AWS CDKを使用して展開する方法を学...

データサイエンス

情報とエントロピー

1948年、数学者のクロード・E・シャノンが「通信の数学的理論」という記事を発表し、機械学習における重要な概念であるエント...

機械学習

アプリケーションの近代化における生成AIの活用

「生成AIは、極度の自動化の時代において、アプリケーションの近代化プログラムを加速させるための強力なエンエーブラーとな...

コンピュータサイエンス

ジェイソン・アーボン:「百万年後、超パワフルなコンピュータは我々の時代のテスターたちを称えるでしょう」

「Jason Arbonと一緒に、テストにおけるAIの使用、いくぶん不公平なマニュアルQA vs. 自動化QAの闘い、新しいテクノロジーの...