疾病の原因を特定するための遺伝子変異のカタログ
遺伝子変異カタログ
新しいAIツールが、7100万の「ミスセンス」変異の効果を分類します
疾病の根本原因を解明することは、人間の遺伝学における最大の課題の一つです。数百万の可能な変異と限られた実験データの中で、どれが疾病の原因になり得るかはまだ謎のままです。この知識は、迅速な診断と命を救う治療法の開発に不可欠です。
今日、研究者がそれらがどのような効果を持つかをより詳しく学べる「ミスセンス」変異のカタログを公開しています。ミスセンス変異は、人間のタンパク質の機能に影響を与える遺伝子変異です。一部の場合、システィック線維症、鎌状赤血球貧血、またはがんなどの病気を引き起こす可能性があります。
AlphaMissenseカタログは、ミスセンス変異を分類するための新しいAIモデルであるAlphaMissenseを使用して開発されました。Scienceに掲載された論文では、AlphaMissenseが71百万の可能なミスセンス変異のうち89%を「おそらく病原性」または「おそらく良性」として分類したことを示しています。これに対して、人間の専門家によって確認されたのはわずか0.1%です。
変異の効果を正確に予測できるAIツールは、分子生物学から臨床および統計遺伝学までのさまざまな分野で研究を加速する力を持っています。疾病原因の変異を解明する実験は高価で手間のかかるものです。すべてのタンパク質はユニークであり、各実験は個別に設計する必要があります。これには数か月かかる場合もあります。AIの予測を使用することで、研究者は一度に何千ものタンパク質の結果のプレビューを得ることができます。これにより、リソースの優先順位を付けてより複雑な研究を加速することができます。
- メリーランド大学とMeta AIの研究者は、「OmnimatteRF」という新しいビデオマッティング手法を提案していますこの手法は、動的な2D前景レイヤーと3D背景モデルを組み合わせたものです
- 「CMUの研究者たちは、スロット中心のモデル(Slot-TTA)を用いたテスト時の適応を提案していますこれは、シーンを共通してセグメント化し、再構築するスロット中心のボトルネックを備えた半教師付きモデルです」
- ペンシルバニア大学の研究者が、軽量で柔軟、モデルに依存しないオープンソースのAIフレームワーク「Kani」を導入し、言語モデルアプリケーションの構築を行います
私たちはすべての予測を研究コミュニティに無料で提供し、AlphaMissenseのモデルコードをオープンソース化しました。
ミスセンス変異とは何ですか?
ミスセンス変異とは、タンパク質内の異なるアミノ酸につながるDNAの一文字の置換です。DNAを言語と考えると、1つの文字を変えることで単語が変わり、文の意味が完全に変わることがあります。この場合、置換はどのアミノ酸が翻訳されるかを変え、タンパク質の機能に影響を与える可能性があります。
平均的な人は9,000以上のミスセンス変異を持っています。ほとんどは良性でほとんど影響を与えませんが、他のものは病原性であり、タンパク質の機能を深刻に乱します。ミスセンス変異は、少数または1つのミスセンス変異が直接的に疾病を引き起こす場合に、希少な遺伝病の診断に使用されます。また、2型糖尿病のような複雑な疾患の研究にも重要です。この疾患は、多様な遺伝的変化の組み合わせによって引き起こされることがあります。
ミスセンス変異の分類は、これらのタンパク質の変化のうち、どれが疾病の原因になり得るかを理解するための重要なステップです。すでに人間で見られた400万以上のミスセンス変異のうち、専門家によって病原性または良性と注釈されているのは2%に過ぎません。つまり、7100万の可能なミスセンス変異のうちの0.1%程度です。その他の変異は、「意義不明の変異」とされています。これは、その影響についての実験データや臨床データが不足しているためです。AlphaMissenseを使用することで、既知の疾患変異データベースで90%の精度を持つしきい値を使用して、89%の変異を分類することができるため、これまでで最も明確な画像が得られました。
病原性または良性:AlphaMissenseが変異を分類する方法
AlphaMissenseは、アミノ酸配列から科学に知られるほぼすべてのタンパク質の構造を予測した私たちの画期的なモデルAlphaFoldに基づいています。私たちの適応モデルは、タンパク質の個々のアミノ酸を変異させるミスセンスバリアントの病原性を予測することができます。
AlphaMissenseを訓練するために、私たちはAlphaFoldを微調整し、ヒトと密接に関連する霊長類集団で見られる変異を区別するラベルに適用しました。一般的に見られる変異は良性と見なされ、一度も見られない変異は病原性と見なされます。AlphaMissenseは、変異によるタンパク質構造の変化やタンパク質安定性への他の影響を予測しません。代わりに、関連するタンパク質配列と変異の構造的な文脈を活用して、変異が病原性である可能性を示す0から1のスコアを生成します。連続的なスコアにより、ユーザーは自分の精度要件に合わせて、変異を病原性または良性と分類するためのしきい値を選択できます。
AlphaMissenseは、遺伝子および実験的な基準において幅広い予測を達成し、そのようなデータを明示的にトレーニングしていない場合でも優れた性能を発揮します。私たちのツールは、ヒトの変異と疾患の関係に関する公共のアーカイブであるClinVarから変異を分類する際に他の計算方法を凌駕しました。また、私たちのモデルは実験室の結果を予測する際にも最も正確な方法であり、それは病原性を測定する異なる方法と一致していることを示しています。
コミュニティリソースの構築
AlphaMissenseは、AlphaFoldをベースに、タンパク質に関する世界の理解をさらに深めるためのものです。1年前、私たちはAlphaFoldを使用して予測された2億のタンパク質構造を公開しました。これにより、世界中の数百万人の科学者が研究を加速し、新たな発見の道を開拓するのに役立っています。AlphaMissenseがゲノミクスの中心にある未解決の問題を解決するのにどのように役立つかを楽しみにしています。また、生物科学全体にわたっても期待しています。
AlphaMissenseの予測は、科学コミュニティに無料で提供されています。EMBL-EBIとの協力により、研究者がより使いやすいようにするために、Ensembl Variant Effect Predictorを通じて利用可能にしています。
ミスセンス変異のルックアップテーブルに加えて、19,000以上のヒトタンパク質において、216億の単一アミノ酸配列置換の拡張予測を共有しました。また、各遺伝子の平均予測も含まれています。これは遺伝子の進化的制約を測定することと類似しており、その遺伝子が生物の生存にどれだけ必要かを示しています。
遺伝子疾患の研究を加速する
この研究を具体化するための重要なステップは、科学コミュニティとの協力です。私たちはGenomics Englandとのパートナーシップを通じて、これらの予測が希少疾患の遺伝学の研究にどのように役立つかを探求してきました。Genomics EnglandはAlphaMissenseの結果を、以前に人間の参加者と集約された変異の病原性データと照合しました。彼らの評価により、私たちの予測が正確で一貫していることが確認され、AlphaMissenseに対する別の現実のベンチマークが提供されました。
私たちの予測は直接臨床で使用されることを意図していませんが、他の証拠と共に解釈する必要があります。この研究は、希少な遺伝性疾患の診断の改善や新しい疾患原因遺伝子の発見につながる可能性があります。
最終的には、AlphaMissenseを含む他のツールが、疾患をより良く理解し、新しい命を救う治療法の開発に貢献することを期待しています。
AlphaMissenseについてさらに詳しくはこちら:
Science誌での論文を読む:https://www.science.org/doi/10.1126/science.adg7492
Ensembl Variant Effect Predictorプラグインをダウンロードする:https://www.ensembl.org/info/docs/tools/vep/script/vep_plugins.html
AlphaMissenseのコードをダウンロードする:https://github.com/deepmind/alphamissense
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「Google ResearchがMediaPipe FaceStylizerを紹介:少数のショットでの効率的な顔スタイリゼーションのための設計」
- 「韓国のAI研究がマギキャプチャを紹介:主題とスタイルの概念を統合して高解像度のポートレート画像を生成するための個人化手法」
- 「MITの学者たちは、生成型AIの社会的な影響を探るためのシードグラントを授与されました」
- 「タンパク質設計の次は何か?マイクロソフトの研究者がエボディフ:シーケンスファーストのタンパク質エンジニアリングのための画期的なAIフレームワークを紹介」
- このAI研究は、AstroLLaMAを紹介しますこれは、ArXivからの30万以上の天文学の要約を使用して、LLaMA-2からファインチューンされた7Bパラメーターモデルです
- MITとマイクロソフトの研究者が、DoLaという新しいAIデコーディング戦略を紹介しましたこれは、LLMsにおける幻覚を減らすことを目的としています
- 「AIを活用したツールにより、3Dプリント可能なモデルの個別化が容易になります」