「フェイスブックの10億スケールの検索アルゴリズムがプロテオミックデータを効率的にナビゲートするために再利用されました」

『プロテオミックデータを効率的にナビゲートするために、Facebookの10億規模の検索アルゴリズムが再利用されました』

Julia Koblitzによる写真(出典:Unsplash)

新しい論文では、プロテオミクスデータの管理と探索における課題に対処するために作成された新しい手法とウェブベースのツール、Spectroscapeが紹介されています。最新の質量分析実験では大量のデータが生成されますが、これらのデータは個々の出版物やプロジェクトに関連するリポジトリに保存され、検索、閲覧、共有、再利用が困難です。新しいパラダイムでは、スペクトルの類似性に基づいてデータを整理することが推奨されていますが、大規模なスペクトルアーカイブの運用や利用は計算上の課題があり、一般的なプロテオミクス研究者にとっては容易にアクセスすることができません。Spectroscapeは、FacebookのFast AI Searchパッケージに基づいたアルゴリズムを用いたインデックススキームに基づき、スペクトルアーカイブのリアルタイムクエリと可視化を可能にするために開発されました。トレーニング時に、Spectroscapeはスペクトルの高次元空間上での近似的なスペクトル類似性に基づいてスペクトルをグループ化し、これによりユーザーはスペクトル類似性に基づいてデータ全体のリポジトリを検索し、瞬時の結果を得ることができます。本論文で示されるSpectroscapeの応用例には、類似スペクトルのクラスターの分析、関連によるスペクトルの同定、同定のエラーの修正、外れ値の検出、データセット間の相互参照の作成、クラスターを検査して新しい生物学の発見を可能にすることが挙げられます。この手法は非常に高い再現率を持ち、非常に高速であり、科学者はこれらの機能を無料で利用できます。

プロテオミクスは、タンデム質量分析スペクトルのリポジトリであるスペクトルアーカイブを利用して、タンパク質の同定やポストトランスレーション修飾やアミノ酸置換の検出に重要な役割を果たしています。しかし、…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more