ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました

Researchers at Michigan State University developed a Python library called DANCE to support large-scale single-cell gene expression analysis.

単一モダリティのプロファイリング(RNA、タンパク質、オープンクロマチン)から多モダリティのプロファイリングや空間的トランスクリプトミクスまで、単一細胞の解析技術は近年急速に進化しています。特に機械学習に基づくコンピュータアプローチの急速な拡大により、多くの計算アプローチが生まれました。

現在のアプローチの多様性と複雑さのため、元の論文の結果を再現することは困難です。ハイパーパラメータの調整、プログラミング言語の非互換性、公開されたコードベースの欠如など、多くの障害が存在します。既存の研究のほとんどは限られたデータセットと不十分な方法論との比較でパフォーマンスを報告しているため、方法を完全に評価するためには体系的なベンチマーク手法が必要です。

最近の研究の一環として、ミシガン州立大学、ワシントン大学、浙江工業大学、スタンフォード大学、ジョンソン・エンド・ジョンソンの研究者らは、単一細胞解析の進歩を加速させるために設計されたDANCEというディープラーニングライブラリとベンチマークを紹介しています。

DANCEは、スケールで単一細胞データを分析するための包括的なツールセットを提供し、開発者がより簡単かつ効率的に独自のディープラーニングモデルを作成できるようにします。また、単一細胞解析のさまざまな計算モデルのパフォーマンスを比較するためのベンチマークとして使用することもできます。現在のDANCEには、3つのモジュール、8つのタスク、32のモデル、21のデータセットのサポートが含まれています。

現在、DANCEは以下の機能を提供しています:

  1. 単一モダリティの解析
  2. 多モダリティの解析
  3. 空間的トランスクリプトミクスの解析

オートエンコーダとGNN(グラフニューラルネットワーク)は、幅広く使用されているディープラーニングフレームワークであり、あらゆる場面で活用できます。研究論文によると、DANCEは単一細胞解析のための包括的なベンチマークプラットフォームとして初めて開発されました。

この研究では、研究者らは新しいコンポーネントを使用しました。彼らは、タスク固有の標準ベンチマークデータセットをまとめ、単一のパラメータ調整で簡単に利用できるようにしました。すべてのタスクに対して、基本的なクラシカルなディープラーニングアルゴリズムが実装されています。収集されたすべてのベンチマークデータセットは、元の研究と同様またはそれ以上の結果を得るまで、ベースラインを微調整するために使用されます。エンドユーザーは、事前にすべてのスーパーパラメータをまとめてラップしたコマンドラインを実行するだけで、微調整されたモデルのパフォーマンスを取得することができます。

チームはバックボーンとしてPyTorch Geometric(PSG)フレームワークを使用しました。さらに、ベースラインをフィット-予測-スコアのフレームワークに変換することで、ベースラインを標準化しました。各タスクについて、すべての実装されたアルゴリズムは、グリッドサーチを介して収集されたすべての標準ベンチマークで微調整され、最適なモデルを得るために使用されます。関連するスーパーパラメータは、ユーザーの再現性のために単一のコマンドラインに保存されます。

チームは、自分のデバイスの処理能力とストレージ容量に完全に依存する必要がないようにするため、DANCEをSaaSサービスとして提供する予定です。また、ディープラーニングベースのモデルの高速なトレーニングのために、グラフィックスプロセッシングユニット(GPU)のサポートも提供しています。

現在のDANCEは、前処理とグラフ作成のための統一されたツールセットが不足しています。チームは将来的にこれに取り組む予定です。また、DANCEはSaaSサービスとして提供されるため、ユーザーは自身のデバイスの処理能力とストレージ容量に完全に頼る必要はありません。

この記事は、「DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis」という研究論文をもとにMarkTechPostスタッフがまとめた研究概要記事です。この研究に関するすべてのクレジットはこのプロジェクトの研究者に帰属します。論文、コード、ツールをチェックしてください。
ML Subredditに参加するのを忘れないでください

Michigan State Universityの研究者らが、単一細胞の遺伝子発現を分析するためのディープラーニングモデルをサポートするPythonライブラリ「DANCE」を開発しました。

この記事はMarkTechPostに掲載されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

KAISTとGoogleの研究者は、コラボレーションスコア蒸留(CSD)を導入しましたこれは、一貫した視覚合成のためのテキストから画像への拡散モデルの単数形を拡張したAIの手法です

テキストから画像への拡散モデルは、数十億の画像テキストペアと効果的なトポロジーを用いて構築されており、入力として与え...

AI研究

ジョンズ・ホプキンス大学とUCサンタクルーズ校の研究者が、画像ベースのAI学習の画期的な進歩であるD-iGPTを発表しました

“` 自然言語処理(NLP)は、GPTシリーズなどの大規模言語モデル(LLMs)の導入により、さまざまな言語的なタスクに対し...

機械学習

より速い治療:Insilico Medicineが生成型AIを使用して薬剤開発を加速する方法

生成AIは比較的新しい家庭用語ですが、薬剤研究会社Insilico Medicineは、長年にわたってこれを使用して、深刻な疾患の新しい...

AI研究

ETHチューリッヒとマイクロソフトの研究者らが提案したX-Avatarは、人間の体の姿勢と顔の表情をキャプチャできるアニメーション可能な暗黙の人間アバターモデルです

ポーズ、見つめること、表情、手のジェスチャーなど、総称して「ボディランゲージ」と呼ばれるものは、多くの学術的研究の対...

AI研究

「UCLA研究者がGedankenNetを紹介:物理法則や思考実験から学ぶ自己教示AIモデルが計算機画像処理を進化させる」

深層学習の最近の進展は、計算画像処理、顕微鏡、ホログラフィ関連の分野に大きな影響を与えています。これらの技術は、バイ...

機械学習

「テキストゥアをご紹介します:3Dメッシュのテキストゥアリングのための新しい人工知能(AI)フレームワーク」

テキストから画像を生成することは、人工知能(AI)の分野における新しい興味深い研究領域であり、テキストの説明に基づいて...