ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました

Researchers at Michigan State University developed a Python library called DANCE to support large-scale single-cell gene expression analysis.

単一モダリティのプロファイリング(RNA、タンパク質、オープンクロマチン)から多モダリティのプロファイリングや空間的トランスクリプトミクスまで、単一細胞の解析技術は近年急速に進化しています。特に機械学習に基づくコンピュータアプローチの急速な拡大により、多くの計算アプローチが生まれました。

現在のアプローチの多様性と複雑さのため、元の論文の結果を再現することは困難です。ハイパーパラメータの調整、プログラミング言語の非互換性、公開されたコードベースの欠如など、多くの障害が存在します。既存の研究のほとんどは限られたデータセットと不十分な方法論との比較でパフォーマンスを報告しているため、方法を完全に評価するためには体系的なベンチマーク手法が必要です。

最近の研究の一環として、ミシガン州立大学、ワシントン大学、浙江工業大学、スタンフォード大学、ジョンソン・エンド・ジョンソンの研究者らは、単一細胞解析の進歩を加速させるために設計されたDANCEというディープラーニングライブラリとベンチマークを紹介しています。

DANCEは、スケールで単一細胞データを分析するための包括的なツールセットを提供し、開発者がより簡単かつ効率的に独自のディープラーニングモデルを作成できるようにします。また、単一細胞解析のさまざまな計算モデルのパフォーマンスを比較するためのベンチマークとして使用することもできます。現在のDANCEには、3つのモジュール、8つのタスク、32のモデル、21のデータセットのサポートが含まれています。

現在、DANCEは以下の機能を提供しています:

  1. 単一モダリティの解析
  2. 多モダリティの解析
  3. 空間的トランスクリプトミクスの解析

オートエンコーダとGNN(グラフニューラルネットワーク)は、幅広く使用されているディープラーニングフレームワークであり、あらゆる場面で活用できます。研究論文によると、DANCEは単一細胞解析のための包括的なベンチマークプラットフォームとして初めて開発されました。

この研究では、研究者らは新しいコンポーネントを使用しました。彼らは、タスク固有の標準ベンチマークデータセットをまとめ、単一のパラメータ調整で簡単に利用できるようにしました。すべてのタスクに対して、基本的なクラシカルなディープラーニングアルゴリズムが実装されています。収集されたすべてのベンチマークデータセットは、元の研究と同様またはそれ以上の結果を得るまで、ベースラインを微調整するために使用されます。エンドユーザーは、事前にすべてのスーパーパラメータをまとめてラップしたコマンドラインを実行するだけで、微調整されたモデルのパフォーマンスを取得することができます。

チームはバックボーンとしてPyTorch Geometric(PSG)フレームワークを使用しました。さらに、ベースラインをフィット-予測-スコアのフレームワークに変換することで、ベースラインを標準化しました。各タスクについて、すべての実装されたアルゴリズムは、グリッドサーチを介して収集されたすべての標準ベンチマークで微調整され、最適なモデルを得るために使用されます。関連するスーパーパラメータは、ユーザーの再現性のために単一のコマンドラインに保存されます。

チームは、自分のデバイスの処理能力とストレージ容量に完全に依存する必要がないようにするため、DANCEをSaaSサービスとして提供する予定です。また、ディープラーニングベースのモデルの高速なトレーニングのために、グラフィックスプロセッシングユニット(GPU)のサポートも提供しています。

現在のDANCEは、前処理とグラフ作成のための統一されたツールセットが不足しています。チームは将来的にこれに取り組む予定です。また、DANCEはSaaSサービスとして提供されるため、ユーザーは自身のデバイスの処理能力とストレージ容量に完全に頼る必要はありません。

この記事は、「DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis」という研究論文をもとにMarkTechPostスタッフがまとめた研究概要記事です。この研究に関するすべてのクレジットはこのプロジェクトの研究者に帰属します。論文、コード、ツールをチェックしてください。
ML Subredditに参加するのを忘れないでください

Michigan State Universityの研究者らが、単一細胞の遺伝子発現を分析するためのディープラーニングモデルをサポートするPythonライブラリ「DANCE」を開発しました。

この記事はMarkTechPostに掲載されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

トップ7の列操作でより効果的にPandasデータフレームを使用する

データ分析に関しては、データを操作して準備するために最もよく使用されるPythonライブラリはPandasですでは、列に対するト...

機械学習

テキストによる画像および3Dシーン編集の高精度化:『Watch Your Steps』に出会う

ニューラル放射場(NeRF)は、正確で直感的な視覚化を作成する能力により、大いに人気が高まっています。これにより、イメー...

機械学習

「プログラマーの生産性を10倍にするための5つの無料のAIツール」

「これらの5つのAIツールは、プログラマーやコーダーの生活を簡単にするために、コーディングプロジェクトの速度と精度を向上...

データサイエンス

軌跡予測のためのマップマッチング

この記事では、ノイズのあるGPSセンサーからサンプリングされた過去のトリップのデータベースを使用して、デジタル道路ネット...

機械学習

NVIDIAは、Generative AIを用いて薬物探索を加速させるためにGenentechと協力

ジェネンテック(ロシュグループの一員)は、 生成AI を使って新しい治療法を発見し、患者に効果的に治療を提供することを先...

機械学習

DISC-FinLLMとは、複数の専門家のファインチューニングに基づいた中国の金融大規模言語モデル(LLM)です

“` 人工知能の分野で最大の進歩は、大規模言語モデル(LLM)の導入です。これらの自然言語処理(NLP)ベースのモデルは...