メイヨークリニックのAI研究者たちは、拡散モデルを活用したマルチタスク脳腫瘍インペインティングアルゴリズムを構築するための機械学習ベースの手法を紹介しました
Mayo Clinic's AI researchers introduced a machine learning-based approach using diffusion models to build a multitask brain tumor imputation algorithm.
近年、医用画像に関連するAI、特に機械学習(ML)に関する出版物の数は急増しています。Meshキーワード「人工知能」と「放射線学」を使用して現在のPubMedの検索では、2021年には5,369件の論文が見つかりました。これは2011年の結果の5倍以上です。MLモデルは、分類から意味的セグメンテーション、物体検出、画像生成まで、医療の効率と結果を改善するために常に開発されています。例えば、診断放射線学の数多くの公開報告によれば、MLモデルは特定のタスク(例:異常検出や病理スクリーニング)で医療専門家と同等またはそれ以上のパフォーマンスを発揮することができると示されています。
したがって、AIを正しく使用すると、放射線科医の助けとなり、彼らの労働を大幅に削減できることは否定できません。医療画像のMLモデルの開発に対する関心の高まりにもかかわらず、実用上の課題がこれらのモデルの適用を制限したり、実質的なバイアスを生じさせる可能性があります。データの不足とデータの不均衡がそのうちの2つです。一方で、医療画像のデータセットは、ImageNetなどの自然な写真データセットよりもはるかに小さいことがよくあり、患者のプライバシーの問題から機関のデータセットを結集するか公開することが不可能な場合もあります。他方で、データサイエンティストがアクセスできる医療画像のデータセットでさえも、よりバランスが取れている可能性があります。
つまり、特定の病理を持つ患者の医療画像データの量は、一般的な病理または健康な人々のデータに比べて著しく低いです。不十分に大きなまたは不均衡なデータセットを使用して機械学習モデルをトレーニングまたは評価すると、モデルのパフォーマンスに系統的なバイアスが生じる可能性があります。データの不足とデータの不均衡に対抗するための主要な戦略の1つは、合成画像生成です。これには、匿名化された医療画像データセットの公開や、データ共有なしで複数の機関のデータセット上で機械学習(ML)モデルの開発を可能にするフェデレーテッドラーニングなどの戦略の推奨も含まれます。
- ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました
- 中国からの新しいAI研究、「Meta-Transformer マルチモーダル学習のための統一されたAIフレームワーク」を提案する
- KAIST(韓国科学技術院)からの新しいAI研究、FLASK(スキルセットに基づく言語モデルの細かい評価フレームワーク)を紹介
生成モデルは、実際の患者に属さないリアルな医療画像データを学習し生成することができ、患者のプライバシーを危険にさらすことなく公開することができます。生成的対抗ネットワーク(GAN)が登場して以来、高品質な合成データを生成できるさまざまな生成モデルが紹介されてきました。これらのモデルの多くはラベル付けされていない画像データを生成するため、セルフスーパーバイズドやセミスーパーバイズドのダウンストリームモデルなど特定のアプリケーションに役立つ場合があります。さらに、他の一部のモデルは条件付き生成が可能であり、事前に定義された臨床的、テキスト的、または画像的変数に基づいて画像を生成することができます。
デノイジング拡散確率モデル(DDPM)は、合成画像の品質と出力の多様性においてGANを上回る新しいクラスの画像生成モデルです。この後者の生成モデルのクラスは、ラベル付きの合成データを生成することができ、機械学習の研究、医療画像の品質、患者のケアを進めることができます。合成医療画像データの生成において非常に成功しているにもかかわらず、GANは出力の多様性の欠如と不安定なトレーニングのためにしばしば批判されています。オートエンコーダの深層学習モデルは、GANよりもトレーニングが容易でより多様な出力を生成するような、より伝統的な代替手法です。ただし、彼らの合成結果はGANの画質には及びません。
マルコフ連鎖理論に基づく拡散モデルは、最初の画像にランダムなガウスノイズをパックして徐々にノイズを除去することで、合成出力を生成する方法を学習します。この反復的なノイズ除去プロセスにより、拡散モデルの推論実行は他の生成モデルと比較してかなり遅くなります。しかし、これにより、入力データからより表現的な特徴を抽出することができ、他のモデルを上回るパフォーマンスを発揮することができます。この方法論の論文では、マルチシーケンシャル脳磁気共鳴画像(MRI)研究におけるマルチタスク脳腫瘍インペインティングに使用できる拡散モデルを紹介しています。
彼らは、脳MRIのT1重み付け(T1)、造影T1重み付け(T1CE)、T2重み付け(T2)、またはFLAIRシーケンスの2次元(2D)軸スライスを受け取り、そのスライスのユーザー定義の切り取り領域に高品質な合成画像を生成することができる拡散モデルを作成しました。生成される画像は高度なグリオーマとその関連コンポーネント(周囲の浮腫など)または腫瘍のない(正常と思われる)脳組織のいずれかです。
高度なグリオーマの発生率は、アメリカでは100,000人あたり3.56であり、脳腫瘍に関する公開されているMRIデータセットはほんのわずかしかありません。彼らのモデルは、限られたデータの中で脳MRIスライス上の合成腫瘍または腫瘍のない組織を構成する機能を持つML研究者に編集(誘発または除去)を許可します。このツールはオンラインで公開されており、利用することができます。モデルはGitHubでドキュメントと共にオープンソース化されています。
この記事は、研究論文「DIFFUSION MODELSを用いたマルチタスク脳腫瘍インペイント法:方法論レポート」に基づいてMarktechpostスタッフがまとめた研究概要記事です。この研究に関する全てのクレジットは、このプロジェクトの研究者に帰属します。論文、コード、ツールをご覧ください。
当社のMLサブレディットに参加していただくことをお忘れなく
Mayo ClinicのAI研究者たちは、拡散モデルを活用してマルチタスク脳腫瘍インペイントアルゴリズムを構築するための機械学習ベースの手法を紹介しました。詳細はMarkTechPostをご覧ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Salesforce AIは、既存の拡散モデルを与えられた場合に、テキストから画像への拡散生成を行う新しい編集アルゴリズム「EDICT」を開発しました
- 「UCLAの研究者が提案するPhyCV:物理に触発されたコンピュータビジョンのPythonライブラリ」
- 「CMUの研究者がBUTD-DETRを導入:言語発話に直接依存し、発話で言及されるすべてのオブジェクトを検出する人工知能(AI)モデル」
- 「バイトダンスAI研究は、連続および離散パラメータのミックスを使用して、高品質のスタイル化された3Dアバターを作成するための革新的な自己教師あり学習フレームワークを提案しています」
- 画像分類において、拡散モデルがGANより優れていることがAI研究で明らかになりましたこの研究では、BigBiGANなどの同等の生成的識別的手法に比べて、拡散モデルが分類タスクにおいて優れた性能を発揮することが示されました
- 「新しいAI研究は、3D構造に基づいたタンパク質表現学習のためのシンプルで効果的なエンコーダーを提案する」
- 新しいAI研究が、大規模言語モデル(LLMs)の能力を分析するためのプロンプト中心のアプローチを提案しています