『AWSプロトタイピングによるICL-GroupのAmazon SageMaker上でのコンピュータビジョンモデルの構築』
『Amazon SageMaker上でのコンピュータビジョンモデル構築:ICL-GroupのAWSプロトタイピング』
ICLとAWSの従業員が共同執筆した顧客投稿です。
ICLは、イスラエルを拠点とする多国籍の製造および鉱業会社であり、ユニークな鉱物に基づいた製品を製造し、主に農業、食品、工業材料の三つの市場で人類の基本的なニーズを満たしています。彼らの鉱山では、機械の故障が収益の損失や環境への損害につながる可能性があるため、監視が必要な産業用機器が使用されています。しかし、これらの鉱山機械にリモート監視のためのセンサーを取り付けることは困難です。非常に過酷な条件(低温、高温、振動、塩水、ほこり)のためです。そのため、ほとんどの機械は現地の労働者によって手動または視覚的に常時監視されています。これらの労働者は機械の状態を監視するために頻繁にカメラ画像を確認します。これまでにこのアプローチはうまく機能していましたが、拡張性がなく比較的高いコストがかかります。
このビジネスの課題を克服するために、ICLは鉱山機器を自動監視するために機械学習(ML)とコンピュータビジョン(CV)を使用するための内部能力を開発することを決定しました。従来の鉱山会社として、データサイエンス、CV、またはMLのスキルを持つ内部リソースの利用可能性は限定的でした。
この投稿では、以下について説明します:
- 「2024年に探索する必要のある10の最高のGPU」
- 一緒にAIを学びましょう−Towards AIコミュニティニュースレター#5
- このAI論文は、高度な時空間予測のためのニューラルオペレータの自己回帰エラーに対するディープラーニングソリューションを探求しています
- ICLが鉱山装置の自動監視を可能にし、効率を向上させ廃棄物を削減するためにCVソリューションを構築および維持するための内部能力をどのように開発したか
- AWSプロトタイププログラムのサポートを受けて開発された鉱山スクリーナーのソリューションについての詳細
この投稿で説明されている手法を使用して、ICLはAWS上でフレームワークを開発し、約30のカメラから抽出されたビジョンに基づいた他のユースケースを構築することができました。製品現場で数千のカメラにスケーリングする可能性もあります。
AWSプロトタイピングを通じて内部能力を構築する
ビジネスクリティカルなワークロードのためのMLソリューションの構築と維持には、十分にスキルがあるスタッフが必要です。こうした活動を外部に委託することはしばしばできません。なぜなら、ビジネスプロセスに関する内部のノウハウを技術的なソリューション構築と組み合わせる必要があるからです。そのため、ICLは必要なスキルを取得するために、自社の鉱山装置を監視するためのCVソリューションの構築に向けてAWSに支援を求めました。
AWSプロトタイピングは、AWSが専門家を顧客の開発チームに組み込んでミッションクリティカルなユースケースを開発する投資プログラムです。このようなエンゲージメントでは、顧客の開発チームが3〜6週間の期間をかけてユースケースを構築し、ハンズオンで支援を受けながら基盤となるAWSのテクノロジーについて学ぶことができます。対応するユースケースに加えて、顧客のニーズとしては、3〜7人の開発者が前述のユースケースの構築に80%以上の作業時間を費やすことが求められます。この期間中、AWSの専門家は顧客のチームに完全に所属し、リモートまたは現地で協力します。
ICLのコンピュータビジョンのユースケース
プロトタイピングのエンゲージメントのために、ICLは鉱山スクリーナーの監視ユースケースを選択しました。スクリーナーは、水に溶けた鉱物が処理される大型の産業用鉱山機械です。水は機械の上部から下部に向かって複数のレーンに流れます。各レーンごとに流入が監視されます。レーンから流入がなくなるとオーバーフローと呼ばれ、機械が過負荷になっていることを示します。オーバーフローした流入は、スクリーナーによって処理されずに失われてしまう鉱物です。これを避けるためには流入の調整が必要です。MLソリューションがない場合、オーバーフローは人間によって監視され、オーバーフローが観察されて対処されるまで時間がかかる可能性があります。
以下の画像は、CVモデルの入力と出力を示しています。生のカメラ画像(左)はセマンティックセグメンテーションモデル(中央)を使用して異なるレーンを検出します。その後、モデル(右)はカバレッジ(白)とオーバーフロー(赤)を推定します。
プロトタイプの取り組みは、特定の種類の機械に焦点を当てていましたが、CVを使用してカメラを使用し、画像を自動的に処理する一般的なアプローチは、より広範な範囲の鉱業機器にも適用できます。これにより、ICLはプロトタイプの取り組み中に得たノウハウを他の場所、カメラの種類、機械にも適用できるだけでなく、第三者のサポートを必要とせずにMLモデルを維持することも可能です。
取り組み中、AWSの専門家とICLの開発チームは毎日会って解決策を共同で開発していました。ICLのデータサイエンティストは自分の割り当てられたタスクに独自に取り組むか、AWSのML専門家からの手付かずのペアプログラミングのサポートを受けました。このアプローチにより、ICLのデータサイエンティストはSageMakerを使用してMLモデルを体系的に開発する経験を得るだけでなく、これらのモデルをアプリケーションに組み込み、モデルの自動再学習やモデルのモニタリングを含む、モデルのライフサイクル全体を自動化する能力も身につけました。このコラボレーションの4週間後、ICLは追加のサポートなしで8週間以内にこのモデルを本番環境に移行し、その後他のユースケースのモデルを構築することができました。この取り組みの技術的なアプローチについては、次のセクションで説明します。
SageMakerを使用した鉱山スクリーナーのモニタリング(CVモデル利用)
SageMakerは、MLモデルの完全なライフサイクルを扱う完全管理型プラットフォームです。データのラベリングからモデルのトレーニングや最適化、本番環境でのホスティングまで、MLモデルに取り組むチームをサポートするサービスと機能を提供しています。ICLは、プロジェクトに着手する前に、カメラを設置し、前の画像(最も左の画像)を取得し、それらをAmazon Simple Storage Service(Amazon S3)バケットに保存しました。モデルのトレーニングの前に、トレーニングデータを生成する必要があります。ICLとAWSの共同チームは、以下の3つのステップでこれに取り組みました:
- SageMaker Ground Truthを使用した意味的セグメンテーションのラベリングジョブを行い、以下の画像に示すようにデータにラベルを付けました。
- 画像拡張技術を使用してラベル付けされた画像を前処理し、データサンプルの数を増やしました。
- ラベル付けされた画像をトレーニング、テスト、検証セットに分割し、トレーニングプロセス中にモデルのパフォーマンスと精度を適切に測定することができるようにしました。
MLワークロードの本番規模を実現するために、これらのステップを自動化することは、トレーニング入力の品質を維持するために重要です。そのため、新しい画像がSageMaker Ground Truthを使用してラベル付けされるたびに、前処理と分割のステップが自動的に実行され、その結果得られたデータセットがAmazon S3に保存されます。また、モデルの展開ワークフローも、更新されたモデルが利用可能になった場合に自動的にエンドポイントを更新するために、SageMakerのアセットを使用します。
ICLは、MLモデルを本番環境に実装するために複数のアプローチを使用しています。その中には、彼らの現在のAIプラットフォームであるKNIMEを使用するものがあり、これにより、開発環境で開発されたモデルを製品化して迅速に本番環境に展開することができます。KNIMEとAWSサービスを組み合わせるさまざまな組み合わせが分析されましたが、前述のアーキテクチャがICLの環境に最も適していました。
スクリーナーグリッドエリアのセグメンテーションモデルをトレーニングするために、SageMakerの意味的セグメンテーションの組込みアルゴリズムを使用しています。自前のコンテナではなく、この組込みアルゴリズムを選択することで、ICLは畳み込みニューラルネットワーク(CNN)の保守における非差別化された重い作業を取り扱う必要がなくなりますが、そのようなCNNを自分たちのユースケースに使用できます。さまざまな構成とパラメータを試行した後、ICLは完全畳み込みネットワーク(FCN)アルゴリズムとpyramid scene parsing network(PSPNet)を使用してモデルをトレーニングしました。これにより、ICLはプロトタイプの取り組み後1週間以内にモデルの構築を完了することができました。
モデルのトレーニングが完了したら、スクリーナーの監視に使用できるように展開する必要があります。モデルトレーニングと合わせて、このプロセスはAWS Step FunctionsとAWS Lambdaを使用して、完全に自動化され、統合されます。モデルがSageMakerエンドポイントに正常に展開された後、カメラからの入力画像はモデルの入力形式に合わせてリサイズされ、Lambda関数を使用して予測のためにエンドポイントに供給されます。セマンティックセグメンテーション予測の結果とオーバーフロー検出の結果は、Amazon DynamoDBおよびAmazon S3に保存され、ダウンストリームの分析に使用されます。オーバーフローが検出された場合、Amazon Simple Notification Service(Amazon SNS)またはLambda関数を使用して、オーバーフローの自動軽減および影響を受けるスクリーナー上の対応するレーンの制御が行われます。以下の図は、このアーキテクチャを示しています。
結論
この投稿では、イスラエルの鉱山会社であるICLが、カメラを使用して鉱山設備の自動監視のための固有のコンピュータビジョンアプローチを開発した方法について説明しました。まず、組織の挑戦への取り組みを可能にする点からこのような課題に対処する方法を示し、次にAWSを使用してモデルを構築するための詳細な説明を提供しました。監視の課題はICLに特有のものかもしれませんが、AWSの専門家と共にプロトタイプを構築する一般的なアプローチは、AWSの知識を持たない組織にも適用することができます。
ユースケースの本番規模のプロトタイプの構築方法について学びたい場合は、AWSアカウントチームに連絡して、プロトタイピングの取り組みについて話し合ってください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- デシAIはDeciLM-7Bを紹介します:超高速かつ超高精度の70億パラメータの大規模言語モデル(LLM)
- 「CNNにおけるアトラウス畳み込みの総合ガイド」
- 「AIアクトの解読」
- インドのスタートアップ、OpenHathiをリリース:初のヒンディー語LLM
- このAI論文は、イメージとテキストのアラインメントモデルにおける詳細なテキストとビジュアルの説明のための高度な技術を紹介しています
- このAI論文は、「Vary」という新しいアプローチを明らかにしています:高度な多言語認識タスクのための大規模なビジョン言語モデルの視覚語彙を拡張するためのアプローチ
- 『LLM360をご紹介します:最初の完全オープンソースで透明な大規模言語モデル(LLM)』