ミシガン州立大学の研究者たちは、規模の大きな一細胞遺伝子発現の分析をサポートするためのPythonライブラリ「DANCE」を開発しました

Researchers at Michigan State University developed a Python library called DANCE to support large-scale single-cell gene expression analysis.

単一モダリティのプロファイリング(RNA、タンパク質、オープンクロマチン)から多モダリティのプロファイリングや空間的トランスクリプトミクスまで、単一細胞の解析技術は近年急速に進化しています。特に機械学習に基づくコンピュータアプローチの急速な拡大により、多くの計算アプローチが生まれました。

現在のアプローチの多様性と複雑さのため、元の論文の結果を再現することは困難です。ハイパーパラメータの調整、プログラミング言語の非互換性、公開されたコードベースの欠如など、多くの障害が存在します。既存の研究のほとんどは限られたデータセットと不十分な方法論との比較でパフォーマンスを報告しているため、方法を完全に評価するためには体系的なベンチマーク手法が必要です。

最近の研究の一環として、ミシガン州立大学、ワシントン大学、浙江工業大学、スタンフォード大学、ジョンソン・エンド・ジョンソンの研究者らは、単一細胞解析の進歩を加速させるために設計されたDANCEというディープラーニングライブラリとベンチマークを紹介しています。

DANCEは、スケールで単一細胞データを分析するための包括的なツールセットを提供し、開発者がより簡単かつ効率的に独自のディープラーニングモデルを作成できるようにします。また、単一細胞解析のさまざまな計算モデルのパフォーマンスを比較するためのベンチマークとして使用することもできます。現在のDANCEには、3つのモジュール、8つのタスク、32のモデル、21のデータセットのサポートが含まれています。

現在、DANCEは以下の機能を提供しています:

  1. 単一モダリティの解析
  2. 多モダリティの解析
  3. 空間的トランスクリプトミクスの解析

オートエンコーダとGNN(グラフニューラルネットワーク)は、幅広く使用されているディープラーニングフレームワークであり、あらゆる場面で活用できます。研究論文によると、DANCEは単一細胞解析のための包括的なベンチマークプラットフォームとして初めて開発されました。

この研究では、研究者らは新しいコンポーネントを使用しました。彼らは、タスク固有の標準ベンチマークデータセットをまとめ、単一のパラメータ調整で簡単に利用できるようにしました。すべてのタスクに対して、基本的なクラシカルなディープラーニングアルゴリズムが実装されています。収集されたすべてのベンチマークデータセットは、元の研究と同様またはそれ以上の結果を得るまで、ベースラインを微調整するために使用されます。エンドユーザーは、事前にすべてのスーパーパラメータをまとめてラップしたコマンドラインを実行するだけで、微調整されたモデルのパフォーマンスを取得することができます。

チームはバックボーンとしてPyTorch Geometric(PSG)フレームワークを使用しました。さらに、ベースラインをフィット-予測-スコアのフレームワークに変換することで、ベースラインを標準化しました。各タスクについて、すべての実装されたアルゴリズムは、グリッドサーチを介して収集されたすべての標準ベンチマークで微調整され、最適なモデルを得るために使用されます。関連するスーパーパラメータは、ユーザーの再現性のために単一のコマンドラインに保存されます。

チームは、自分のデバイスの処理能力とストレージ容量に完全に依存する必要がないようにするため、DANCEをSaaSサービスとして提供する予定です。また、ディープラーニングベースのモデルの高速なトレーニングのために、グラフィックスプロセッシングユニット(GPU)のサポートも提供しています。

現在のDANCEは、前処理とグラフ作成のための統一されたツールセットが不足しています。チームは将来的にこれに取り組む予定です。また、DANCEはSaaSサービスとして提供されるため、ユーザーは自身のデバイスの処理能力とストレージ容量に完全に頼る必要はありません。

この記事は、「DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis」という研究論文をもとにMarkTechPostスタッフがまとめた研究概要記事です。この研究に関するすべてのクレジットはこのプロジェクトの研究者に帰属します。論文、コード、ツールをチェックしてください。
ML Subredditに参加するのを忘れないでください

Michigan State Universityの研究者らが、単一細胞の遺伝子発現を分析するためのディープラーニングモデルをサポートするPythonライブラリ「DANCE」を開発しました。

この記事はMarkTechPostに掲載されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

自動化、Ansible、人工知能

AnsibleがAIツールを統合開発環境に導入し、自動化コーディングの経験をよりシンプルでスムーズかつ効率的にする方法について...

AIニュース

「ベストプロキシサーバー(2023年9月)」

プロキシサーバは、コンピュータが自分自身の代わりにリクエストを行うためのネットワーク上で動作するアプリケーションまた...

人工知能

AI + No-Code 開発者のイノベーションを再定義するヴァイラルコンボ

開発者が絶対に取り戻せないものは時間です著者は、AIに支えられた低コード/ノーコードプラットフォームの価値について議論し...

データサイエンス

超幾何分布の理解

二項分布は、データサイエンスの内外でよく知られた分布ですしかし、あなたはその人気のないいところのいとこである超幾何分...

機械学習

「生成タスクを分類タスクに変換する」

「大規模な汎用言語モデルのコストは、より効率的なタスク特定の分類モデルをトレーニングすることによって軽減することがで...

データサイエンス

コンテンツモデレーションからゼロショット分類へ

もし、追加情報や文脈がない小さなテキストを分析し、自分自身のデータを定義するために最も妥当なラベルを取得したい場合、...