メイヨークリニックのAI研究者たちは、拡散モデルを活用したマルチタスク脳腫瘍インペインティングアルゴリズムを構築するための機械学習ベースの手法を紹介しました

Mayo Clinic's AI researchers introduced a machine learning-based approach using diffusion models to build a multitask brain tumor imputation algorithm.

近年、医用画像に関連するAI、特に機械学習(ML)に関する出版物の数は急増しています。Meshキーワード「人工知能」と「放射線学」を使用して現在のPubMedの検索では、2021年には5,369件の論文が見つかりました。これは2011年の結果の5倍以上です。MLモデルは、分類から意味的セグメンテーション、物体検出、画像生成まで、医療の効率と結果を改善するために常に開発されています。例えば、診断放射線学の数多くの公開報告によれば、MLモデルは特定のタスク(例:異常検出や病理スクリーニング)で医療専門家と同等またはそれ以上のパフォーマンスを発揮することができると示されています。

したがって、AIを正しく使用すると、放射線科医の助けとなり、彼らの労働を大幅に削減できることは否定できません。医療画像のMLモデルの開発に対する関心の高まりにもかかわらず、実用上の課題がこれらのモデルの適用を制限したり、実質的なバイアスを生じさせる可能性があります。データの不足とデータの不均衡がそのうちの2つです。一方で、医療画像のデータセットは、ImageNetなどの自然な写真データセットよりもはるかに小さいことがよくあり、患者のプライバシーの問題から機関のデータセットを結集するか公開することが不可能な場合もあります。他方で、データサイエンティストがアクセスできる医療画像のデータセットでさえも、よりバランスが取れている可能性があります。

つまり、特定の病理を持つ患者の医療画像データの量は、一般的な病理または健康な人々のデータに比べて著しく低いです。不十分に大きなまたは不均衡なデータセットを使用して機械学習モデルをトレーニングまたは評価すると、モデルのパフォーマンスに系統的なバイアスが生じる可能性があります。データの不足とデータの不均衡に対抗するための主要な戦略の1つは、合成画像生成です。これには、匿名化された医療画像データセットの公開や、データ共有なしで複数の機関のデータセット上で機械学習(ML)モデルの開発を可能にするフェデレーテッドラーニングなどの戦略の推奨も含まれます。

生成モデルは、実際の患者に属さないリアルな医療画像データを学習し生成することができ、患者のプライバシーを危険にさらすことなく公開することができます。生成的対抗ネットワーク(GAN)が登場して以来、高品質な合成データを生成できるさまざまな生成モデルが紹介されてきました。これらのモデルの多くはラベル付けされていない画像データを生成するため、セルフスーパーバイズドやセミスーパーバイズドのダウンストリームモデルなど特定のアプリケーションに役立つ場合があります。さらに、他の一部のモデルは条件付き生成が可能であり、事前に定義された臨床的、テキスト的、または画像的変数に基づいて画像を生成することができます。

デノイジング拡散確率モデル(DDPM)は、合成画像の品質と出力の多様性においてGANを上回る新しいクラスの画像生成モデルです。この後者の生成モデルのクラスは、ラベル付きの合成データを生成することができ、機械学習の研究、医療画像の品質、患者のケアを進めることができます。合成医療画像データの生成において非常に成功しているにもかかわらず、GANは出力の多様性の欠如と不安定なトレーニングのためにしばしば批判されています。オートエンコーダの深層学習モデルは、GANよりもトレーニングが容易でより多様な出力を生成するような、より伝統的な代替手法です。ただし、彼らの合成結果はGANの画質には及びません。

マルコフ連鎖理論に基づく拡散モデルは、最初の画像にランダムなガウスノイズをパックして徐々にノイズを除去することで、合成出力を生成する方法を学習します。この反復的なノイズ除去プロセスにより、拡散モデルの推論実行は他の生成モデルと比較してかなり遅くなります。しかし、これにより、入力データからより表現的な特徴を抽出することができ、他のモデルを上回るパフォーマンスを発揮することができます。この方法論の論文では、マルチシーケンシャル脳磁気共鳴画像(MRI)研究におけるマルチタスク脳腫瘍インペインティングに使用できる拡散モデルを紹介しています。

彼らは、脳MRIのT1重み付け(T1)、造影T1重み付け(T1CE)、T2重み付け(T2)、またはFLAIRシーケンスの2次元(2D)軸スライスを受け取り、そのスライスのユーザー定義の切り取り領域に高品質な合成画像を生成することができる拡散モデルを作成しました。生成される画像は高度なグリオーマとその関連コンポーネント(周囲の浮腫など)または腫瘍のない(正常と思われる)脳組織のいずれかです。

高度なグリオーマの発生率は、アメリカでは100,000人あたり3.56であり、脳腫瘍に関する公開されているMRIデータセットはほんのわずかしかありません。彼らのモデルは、限られたデータの中で脳MRIスライス上の合成腫瘍または腫瘍のない組織を構成する機能を持つML研究者に編集(誘発または除去)を許可します。このツールはオンラインで公開されており、利用することができます。モデルはGitHubでドキュメントと共にオープンソース化されています。

この記事は、研究論文「DIFFUSION MODELSを用いたマルチタスク脳腫瘍インペイント法:方法論レポート」に基づいてMarktechpostスタッフがまとめた研究概要記事です。この研究に関する全てのクレジットは、このプロジェクトの研究者に帰属します。論文、コード、ツールをご覧ください。
当社のMLサブレディットに参加していただくことをお忘れなく

Mayo ClinicのAI研究者たちは、拡散モデルを活用してマルチタスク脳腫瘍インペイントアルゴリズムを構築するための機械学習ベースの手法を紹介しました。詳細はMarkTechPostをご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

モデルアーキテクチャのための生成AIに向けて

「Attention is All You Need」というトランスフォーマー革命は、深層学習モデルのアーキテクチャの設計に深い影響を与えまし...

機械学習

「ニューラルネットワークの多様性の力を解き放つ:適応ニューロンが画像分類と非線形回帰で均一性を上回る方法」

ニューラルネットワークは、人間の脳に触発された方法でデータを処理するための人工知能の手法です。ニューラルネットワーク...

データサイエンス

初心者向けの生成AIの優しい紹介

ここ数ヶ月間、いわゆる「生成AI」の台頭が見られますその基礎を理解する時が来ました

機械学習

「プロンプトエンジニアリングによるAIの潜在能力の解放」

迅速なエンジニアリングは、簡潔でコンテキスト豊かなクエリの作成スキルであり、AIが最も関連性の高い正確な応答を生成する...

人工知能

「テキストから音声を生成する方法:AIモデルBarkを使用する」

紹介 Barkは、Suno.aiが作成したオープンソースの完全生成的なテキストから音声へのモデルであり、背景音、音楽、単純な効果...