フィリップスは、Amazon SageMakerをベースにしたMLOpsプラットフォームでAI対応のヘルスケアソリューションの開発を加速しています
「フィリップスがAmazon SageMakerを活用し、MLOpsプラットフォームを導入してAI対応のヘルスケアソリューションの開発を迅速化」
これはAWSとPhilipsの共同ブログです。
Philipsは、意味のあるイノベーションを通じて人々の生活を向上させることに焦点を当てたヘルステクノロジー企業です。2014年以来、同社はPhilips HealthSuite Platformを提供しており、これによって医療および生命科学企業が患者ケアを改善するために使用する数十種類のAWSサービスを統合しています。同社は医療提供者、スタートアップ、大学、その他の企業と提携し、世界中の何百万人もの人々により正確な診断とより個別化された治療を提供するのを支援する技術を開発しています。
Philipsのイノベーション戦略の主要なドライバーの一つは人工知能(AI)です。これにより、健康結果を改善し、顧客体験を向上させ、オペレーションの効率化が可能なスマートで個別化された製品やサービスを作成することができます。
Amazon SageMakerは、機械学習オペレーション(MLOps)のための専用ツールを提供し、MLライフサイクル全体のプロセスを自動化および標準化するのに役立ちます。SageMaker MLOpsツールを使用すると、データサイエンティストとMLエンジニアの生産性を向上させながら、本番環境でモデルのパフォーマンスを維持するために、チームは容易にMLモデルをトレーニング、テスト、トラブルシューティング、デプロイ、ガバナンスできます。
- 「LoRAを使用してAmazon SageMakerでWhisperモデルを微調整する」
- 『Generative AIがサイバーセキュリティを強化する3つの方法』
- 「リトリーバル増強生成によるジェネラティブAIの最適化:アーキテクチャ、アルゴリズム、およびアプリケーションの概要」
本投稿では、PhilipsがAWSとパートナーシップを結んでAI ToolSuiteを開発した方法について説明します。このプラットフォームは、実験、データ注釈、トレーニング、モデルデプロイメント、再利用可能なテンプレートといった機能を提供します。これらの機能は、複数の事業ラインが迅速かつ俊敏にイノベーションを行いつつ、中央のコントロールでスケールを拡大できるように構築されています。プラットフォームへの生成AIワークロードの組み込みと、新しいユーザーやチームの素早いオンボードを実現するための進行中の取り組みについても説明します。
顧客の文脈
Philipsは、画像、診断、治療、個人の健康、および連携ケアなどさまざまな領域でAIを使用しています。過去数年間にPhilipsが開発したAI対応ソリューションの例をいくつか挙げると:
- Philips SmartSpeed – MRI用のAIベースの画像技術で、ユニークな圧縮SENSEベースの深層学習AIアルゴリズムを使用して、様々な種類の患者のスピードと画質を向上させます
- Philips eCareManager – 高度な分析と臨床アルゴリズムを使用して、重症患者の遠隔ケアと管理をサポートするテレヘルスソリューション。複数のデータソースからの患者データを処理し、行動可能な洞察、アラート、およびケアチームへの推奨事項を提供します
- Philips Sonicare – ユーザーの歯磨きの行動と口腔の健康を分析し、最適な歯磨き時間、圧力、範囲などのリアルタイムガイダンスと個別の推奨事項を提供するスマート歯ブラシ。これにより、口腔衛生が改善され、虫歯や歯周病の予防ができます。
長年にわたり、Philipsはデータ駆動型のアルゴリズムの開発を先導し、ヘルスケア連続体全体にわたる革新的なソリューションを生み出しました。Philipsは、医用画像再構築や解釈、ワークフロー管理、治療最適化のための多くのMLアプリケーションを開発しています。また、患者モニタリング、画像誘導療法、超音波、個人の健康チームもMLアルゴリズムとアプリケーションを作成しています。しかし、イノベーションは、チーム間で分断されたAI開発環境を使用していたために阻害されていました。これらの環境は、個々のノートパソコンからデスクトップまで、さまざまなオンプレミスの計算クラスターやクラウドベースのインフラストラクチャまで範囲が広がっていました。この異質性は初期のAI開発の取り組みで異なるチームが迅速に進むことを可能にした一方で、AI開発プロセスのスケーリングと効率化の機会を妨げています。
Philipsのデータ駆動型取り組みの潜在能力を本当に解き放つためには、統一された標準化された環境への根本的なシフトが不可欠であることが明らかでした。
主なAI/MLのユースケースとプラットフォームの要件
AI/MLを活用した提案は、クリニシャンが行う管理業務を自動化することで医療に変革をもたらすことができます。たとえば:
- AIは、医用画像を分析して放射線科医の疾患診断をより迅速かつ正確にサポートすることができます
- AIは、患者データを分析し、将来の医療イベントを予測し、予防的なケアを改善することができます
- AIは、患者のニーズに合わせたパーソナライズされた治療を推奨することができます
- AIは、臨床ノートから情報を抽出および構造化し、記録作成を効率化することができます
- AIインターフェースは、患者へのクエリ、リマインダー、症状チェッカーなどのサポートを提供することができます
全体として、AI/MLは、人為的なミスの削減、時間とコストの削減、最適化された患者体験、適時かつ個別の介入を約束しています。
ML開発およびデプロイメントプラットフォームの主な要件の一つは、以下の図に示されているように、継続的かつ反復的な開発とデプロイメントプロセスをサポートする能力でした。
AIアセットの開発は、データの収集とキュレーションが行われるラボ環境で始まり、その後モデルが訓練と検証されます。モデルが準備ができ、使用の承認が得られたら、実世界の製造システムに展開されます。展開後は、モデルのパフォーマンスが継続的にモニタリングされます。実世界のパフォーマンスとフィードバックは、モデルの改善に活かされ、モデルの訓練と展開が完全に自動化されます。
より詳細なAIツールスイートの要件は、以下の3つの使用例に基づいていました:
- エッジでの物体検出を目指したコンピュータビジョンアプリケーションを開発する。データサイエンスチームは、時間のかかるラベリングプロセスを加速するために、AIベースの自動画像注釈ワークフローを期待していました。
- 複数の医療ユニットで統計をベンチマークするためのクラシックなMLモデル群を管理する。このプロジェクトでは、モデルの展開、実験の追跡、モデルの監視の自動化、および将来の監査と再トレーニングのためのプロセス全体に対するより多くの制御が必要でした。
- 診断医療画像の深層学習モデルの品質と市場投入までの時間を改善する。既存のコンピューティングインフラでは並列で多くの実験を実行することができず、モデルの開発が遅れました。また、規制上、数年にわたるモデルトレーニングの完全な再現性を可能にする必要があります。
非機能要件
スケーラブルで堅牢なAI/MLプラットフォームを構築するには、非機能要件を慎重に考慮する必要があります。これらの要件は、プラットフォームの特定の機能を超えて、以下を確保することに焦点を当てています:
- スケーラビリティ – AIツールスイートプラットフォームは、パフォーマンスを損なうことなく、ますます増え続けるデータ、ユーザー、およびAI/MLワークロードを処理できるように、Philipsの洞察ジェネレーションインフラストラクチャを効果的にスケーリングできる必要があります。増加する要求にシームレスに対応するために、水平および垂直にスケーリングするように設計されている必要があります。
- パフォーマンス – プラットフォームは、複雑なAI/MLアルゴリズムを効率的に処理するための高パフォーマンスなコンピューティング機能を提供する必要があります。 SageMakerには、パワフルなGPUを備えたさまざまなインスタンスタイプがあり、モデルのトレーニングや推論タスクを大幅に高速化することができます。また、レイテンシと応答時間を最小限に抑え、リアルタイムまたはほぼリアルタイムの結果を提供する必要があります。
- 信頼性 – プラットフォームは、複数の可用性ゾーンにまたがる高信頼性の堅牢なAIインフラストラクチャを提供する必要があります。このマルチAZアーキテクチャは、リソースとワークロードを異なるデータセンターに分散させることで、AIの稼働を一時的な中断から守る必要があります。
- 可用性 – プラットフォームは24時間365日利用可能であり、メンテナンスやアップグレードのための最小限のダウンタイムが必要です。AIツールスイートの高可用性には、負荷分散、耐障害アーキテクチャ、および積極的なモニタリングが含まれます。
- セキュリティとガバナンス – プラットフォームは、堅牢なセキュリティ対策、暗号化、アクセス制御、専用の役割、および認証メカニズムを採用し、異常な活動の継続的なモニタリングとセキュリティ監査を行う必要があります。
- データ管理 – 効率的なデータ管理はAI/MLプラットフォームにとって重要です。医療業界の規制では特に厳格なデータガバナンスが求められます。データバージョニング、データラインエージ、データガバナンス、およびデータ品質保証などの機能が必要です。これにより、正確かつ信頼性の高い結果を保証できます。
- 相互運用性 – プラットフォームはPhilipsの内部データリポジトリと簡単に統合できるように設計されており、第三者アプリケーションとのデータ交換と共同作業をスムーズに行うことができます。
- 保守性 – プラットフォームのアーキテクチャとコードベースは、整理され、モジュラーで保守可能である必要があります。これにより、PhilipsのMLエンジニアと開発者は、システム全体を中断することなく、更新、バグ修正、および将来の拡張を提供できます。
- リソースの最適化 – プラットフォームは利用状況レポートを非常に注意深くモニタリングし、コンピューティングリソースが効率的に使用されるようにし、需要に応じて動的にリソースを割り当てる必要があります。さらに、PhilipsはAWSの請求とコスト管理ツールを使用して、利用が割り当てられたしきい値を超えた場合にチームが通知を受け取るようにする必要があります。
- モニタリングとログ記録 – プラットフォームは、包括的なモニタリングとログ記録機能のためにAmazon CloudWatchアラートを使用する必要があります。これは、システムのパフォーマンスを追跡し、ボトルネックを特定し、効果的な問題解決を行うために必要です。
- コンプライアンス – プラットフォームは、AI対応提案の規制順守を向上させるのにも役立ちます。リプロダシビリティとトレーサビリティは、エンドツーエンドのデータ処理パイプラインによって自動的に有効にする必要があります。データラインエージ報告書やモデルカードなど、多数の必須文書化アーティファクトを自動的に準備できます。
- テストと検証 – 厳格なテストおよび検証手順が必要です。これにより、AI/MLモデルの正確性と信頼性が保証され、意図しないバイアスが生じることがないようになります。
ソリューション概要
AI ToolSuiteはエンドツーエンドのスケーラブルなAI開発環境で、ネイティブのSageMakerと関連するAI/MLサービスを提供し、Philips HealthSuiteのセキュリティとプライバシーのガードレール、そしてPhilipsのエコシステムの統合を備えています。アクセス権限を持つ3つの役割があります。
- データサイエンティスト – 協力的な作業スペースでデータの準備、モデルの開発とトレーニングを行います。
- MLエンジニア – モデルの展開、モニタリング、メンテナンスを行い、MLアプリケーションを本番環境化します。
- データサイエンス管理者 – チームリクエストに応じてプロジェクトを作成し、ユースケース固有のテンプレートを提供するための独立した環境を提供します。
プラットフォームの開発は、発見、設計、構築、テスト、デプロイの反復サイクルで複数のリリースサイクルで行われました。一部のアプリケーションの特異性により、プラットフォームの拡張には、データストアや専用のアノテーションツールなど、既存のカスタムコンポーネントの埋め込みが必要でした。以下の図はAI ToolSuiteの3層アーキテクチャを示しています。第1層は基盤インフラストラクチャ、第2層は共通のMLコンポーネント、第3層はユーザーケース固有のテンプレートです。
第1層には以下が含まれます:
- 高度な可用性を持つインターネットへのパラメータ化されたアクセスを持つネットワーキング層
- インフラストラクチャの自己サービス供給(IaC)
- Amazon SageMaker Studioドメインを使用した統合開発環境(IDE)
- プラットフォームロール(データサイエンス管理者、データサイエンティスト)
- アーティファクトのストレージ
- 可観測性のためのログと監視
第2層には共通のMLコンポーネントが含まれます:
- 各ジョブとパイプラインの自動化された実験トラッキング
- 新しいモデルビルドの開始に使用されるモデルビルドパイプライン
- モデルトレーニング、評価、登録からなるモデルトレーニングパイプライン
- 最終テストと承認のためにモデルを展開するモデルデプロイパイプライン
- モデルバージョンを簡単に管理するためのモデルレジストリ
- SageMaker Studioユーザーに割り当てるために特定のユースケースに対して作成されたプロジェクトロール
- プロジェクトのためにビルドされた処理、トレーニング、推論コンテナイメージを保存するイメージリポジトリ
- コードアーティファクトを保存するコードリポジトリ
- すべてのプロジェクトデータとアーティファクトを保存するためのAmazon Simple Storage Service(Amazon S3)バケット
第3層には、新しいプロジェクトで必要なカスタムコンポーネントで作成できるプロジェクト固有のテンプレートが含まれます。例えば:
- テンプレート1 – データクエリと履歴追跡コンポーネントを含む
- テンプレート2 – プロプライエタリなアノテーションツールを使用するカスタムアノテーションワークフローを含む
- テンプレート3 – 開発環境とトレーニングルーチンのカスタマイズ、専用HPCファイルシステム、ローカルIDEからのアクセスに使用するカスタムコンテナイメージのコンポーネントを含む
以下の図では、開発、ステージング、プロダクションのための複数のAWSアカウントにわたる主要なAWSサービスが強調されています。
以下のセクションでは、SageMaker、AWS Service Catalog、CloudWatch、AWS Lambda、Amazon Elastic Container Registry(Amazon ECR)、Amazon S3、AWS Identity and Access Management(IAM)など、AWSサービスによって可能になるプラットフォームの主要な機能について説明します。
インフラストラクチャーコード
このプラットフォームでは、Philipsはインフラストラクチャリソースのプロビジョニングと管理を自動化することができるIaCを使用しています。このアプローチは、開発、テスト、または本番用の再現性、スケーラビリティ、バージョン管理、一貫性、セキュリティ、および移植性を改善します。
AWS環境へのアクセス
SageMakerおよび関連するAI/MLサービスは、データの準備、モデル開発、トレーニング、注釈付け、展開に対してセキュリティガードレールを使用してアクセスされます。
分離と共同作業
このプラットフォームでは、データの分離を保証するためにストレージと処理を別々に行い、不正なアクセスやデータの漏洩のリスクを低減します。
また、このプラットフォームは、データサイエンティスト、データサイエンス管理者、およびMLOpsエンジニアなどのクロスファンクショナルなチームを含むAIプロジェクトで重要なチームの共同作業を容易にします。
役割ベースのアクセス制御
役割ベースのアクセス制御(RBAC)は、役割と権限を構造化された方法で定義することにより、権限の管理を容易にし、AWSのAI/MLプロジェクトに関与する異なる人物のアクセス制御を行うために重要です。データサイエンス管理者、データサイエンティスト、注釈管理者、アノテーター、およびMLOpsエンジニアなどの異なる役割に対して、チームやプロジェクトの成長に応じて権限を管理することが容易になります。
データストアへのアクセス
このプラットフォームでは、SageMakerがデータストアにアクセスできるようにし、データを異なるストレージ場所間で重複したり移動したりする必要なく、モデルのトレーニングや推論に効率的に利用できるようにしています。これにより、リソースの使用効率が最適化され、コストが削減されます。
Philips独自の注釈ツールを使用した注釈
AWSは、SageMaker、Amazon SageMaker Ground Truth、およびAmazon CognitoなどのAIおよびMLサービスを提供しており、これらはPhilips独自の社内注釈ツールと完全に統合されています。この統合により、開発者はAWS環境内で注釈付きデータを使用してMLモデルをトレーニングおよび展開することができます。
MLテンプレート
AI ToolSuiteプラットフォームは、さまざまなMLワークフローに対応したAWSのテンプレートを提供しています。これらのテンプレートは、特定のMLユースケースに合わせて事前に設定されたインフラストラクチャのセットアップであり、SageMakerプロジェクトテンプレート、AWS CloudFormation、およびService Catalogなどのサービスを介してアクセスできます。
Philips GitHubとの統合
GitHubとの統合により、バージョン管理、コードレビュー、および自動CI/CD(継続的インテグレーションおよび継続的デプロイメント)パイプラインを提供することで効率が向上し、手作業の削減や生産性の向上が図られます。
Visual Studio Codeの統合
Visual Studio Codeとの統合により、コーディング、デバッグ、およびMLプロジェクトの管理を統一した環境で行うことができます。これにより、MLワークフロー全体がスムーズになり、コンテキストの切り替えが減り、時間を節約することができます。この統合は、チームメンバーがなじみのある開発環境でSageMakerプロジェクトを共同で作業し、バージョン管理システムを利用してコードやノートブックを共有することで、チーム間の協力を向上させます。
モデルとデータの起源と追跡による再現性とコンプライアンス
このプラットフォームでは、データサイエンティストのトレーニングと推論データの変更を追跡するバージョニング機能を提供しており、結果を再現し、データセットの進化を理解するのに役立ちます。
さらに、このプラットフォームではSageMakerの実験トラッキングを可能にしており、ユーザーはML実験に関連するすべてのメタデータ(ハイパーパラメータ、入力データ、コード、モデルアーティファクトなど)をログに記録し、追跡することができます。これらの機能は、規制基準への準拠を示すために不可欠であり、AI/MLワークフローにおける透明性と説明責任を確保するのに重要です。
AI/ML仕様の報告書生成による規制の遵守
AWSは、さまざまな業界標準と規制に対するコンプライアンス認証を維持しています。AI/ML仕様の報告書は、規制要件への遵守を示すための重要な文書です。これらの報告書は、データセット、モデル、およびコードのバージョニングを文書化します。バージョン管理は、データの起源、追跡性、再現性を維持するために重要であり、規制の遵守と監査には欠かせません。
プロジェクトレベルの予算管理
プロジェクトレベルの予算管理により、組織は支出の限度を設定し、予期せぬ費用を避け、MLプロジェクトが予算内に留まることを確認することができます。予算管理により、組織は個々のプロジェクトやチームに特定の予算を割り当てることができ、チームはリソースの無駄や予期せぬコストの急増を早期に把握することができます。予算管理に加えて、アイドルなノートブックを自動的にシャットダウンする機能もありますので、チームメンバーは未使用のリソースの支払いを回避し、使用されていない貴重なリソースを使用可能な状態にし、他のタスクやユーザーに利用できるようにすることができます。
成果
AI ToolSuiteは、フィリップス全体のデータサイエンティスト向けにMLの開発と展開のためのエンタープライズワイドなプラットフォームとして設計され、実装されました。全ビジネスユニットからの多様な要件が収集され、設計と開発の過程で考慮されました。プロジェクトの初期段階で、フィリップスはビジネスチームからチャンピオンを選出し、フィードバックを提供し、プラットフォームの価値を評価するのに役立ちました。
以下の成果が達成されました:
- ユーザーの採用は、フィリップスにとって重要な先行指標の一つです。複数のビジネスユニットからのユーザーがプラットフォームにトレーニングを受け、オンボーディングされましたが、その数は2024年にさらに増加する見込みです。
- データサイエンスの利用効率も重要な指標です。AI ToolSuiteを使用することで、新しいML開発環境を数日ではなく1時間以内に展開することができます。
- データサイエンスチームは、スケーラブルでセキュアかつコスト効率の高いクラウドベースの計算基盤にアクセスすることができます。
- チームは複数のモデルトレーニング実験を並行して実行することができ、平均トレーニング時間を数週間から1〜3日に大幅に短縮しました。
- 環境展開が完全に自動化されているため、クラウドインフラエンジニアの関与がほとんど必要ありませんでした。これにより、運用コストが削減されました。
- AI ToolSuiteの使用により、データとAIの成果物の全体的な成熟度が向上し、MLの良いプラクティス、標準化されたワークフロー、エンドツーエンドの再現性の促進が行われました。これは、ヘルスケア業界での規制遵守には重要な要素です。
生成型AIに向けての展望
組織がAIの最新技術を採用するために競争する中で、組織のセキュリティとガバナンスポリシーの文脈で新しい技術を採用することが重要です。AI ToolSuiteのアーキテクチャは、フィリップス内のさまざまなチームがAWSの生成型AI機能にアクセスできる優れた設計図を提供しています。チームは、Amazon SageMaker JumpStartで提供されるオープンソースモデルを利用することができます。アクセス制御、プロジェクトのプロビジョニング、コスト制御といった必要なガードレールがすでに整備されているため、チームはSageMaker内で生成型AI機能を利用することがシームレスに行えるでしょう。
さらに、プロジェクトの要件に基づいて、個々のアカウントに対して完全管理されたAPI駆動の生成型AIサービスであるAmazon Bedrockへのアクセスが提供され、ユーザーはSageMakerノートブックインターフェースまたは好みのIDEを介してAmazon BedrockのAPIにアクセスすることができます。
医療などの規制された環境で生成型AIを採用する際には、価値と関連するリスクとコストを慎重に考慮する必要があります。また、組織の生成型AI技術の利用を統治するためのリスクと法的なフレームワークを作成する必要があります。データセキュリティ、バイアスと公正さ、規制遵守などの要素も、そのようなメカニズムの一部として考慮する必要があります。
結論
フィリップスは、データ駆動型アルゴリズムの力を活用して医療ソリューションを革新する旅に乗り出しました。数年にわたる診断画像のイノベーションにより、画像再構成からワークフロー管理、治療最適化まで、複数のMLアプリケーションが生まれました。しかし、個々のノートパソコンからオンプレミスクラスタやクラウドインフラまで、さまざまなセットアップが困難な課題を提起しました。システム管理、セキュリティ対策、サポートメカニズム、およびデータプロトコルの分離は、TCOの包括的な視点を妨げ、チーム間のトランジションを複雑にしました。研究開発から本番環境への移行は、起源と再現性の欠如により、モデルの継続的な再トレーニングが困難でした。
PhilipsとAWSの戦略的な協力の一環として、AI ToolSuiteプラットフォームは、SageMakerを使用したスケーラブルでセキュアかつコンプライアントのMLプラットフォームを開発するために作成されました。このプラットフォームは、実験、データ注釈、トレーニング、モデルの展開、再利用可能なテンプレートなどの機能を提供します。これらの機能は、発見、設計、構築、テスト、展開の複数のサイクルを通じて反復的に構築されました。これにより、複数のビジネスユニットがスケールでき、中央の制御の下で迅速かつ俊敏にイノベーションすることができました。
この旅は、医療のイノベーションと効率化を推進するためにAIとMLの力を利用することを目指す組織にとってのインスピレーションとなります。それにより、世界中の患者と医療提供者に利益がもたらされます。この成功をさらに発展させるため、Philipsは革新的なAI対応ソリューションを通じて健康結果の向上により大きな進歩を遂げる用意があります。
PhilipsのAWSにおけるイノベーションについて詳しく知りたい場合は、Philips on AWS をご覧ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- この人工知能論文は、大規模なマルチモーダルモデル(GLaMM)を導入していますこれは、画像と領域の両方の入力を処理する柔軟性を備えた、エンドツーエンドトレーニングされた大規模なマルチモーダルモデルで、ビジュアルグラウンディング能力を提供します
- バーゼル大学病院が、「TotalSegmentator」を発表:体のCT画像の主要な解剖構造を自動的にセグメント化するための深層学習セグメンテーションモデル
- 機械学習を用いたサッカータッチダウンの予測
- 「LangChainが評価しようとしている6つのLLMの問題点」
- 『ゴーストバスター内部:バークレー大学のAI生成コンテンツ検出の新しい方法』
- Learning to build—Towards AI コミュニティニュースレター第1号
- 「マイクロソフトのAzure AIモデルカタログが革新的な人工知能モデルで拡大」