あらゆる種類の分子との相互作用を理解する新しいAIモデルによって、タンパク質デザインの領域での境界を打破する
A new AI model that understands interactions with all types of molecules breaks boundaries in the field of protein design.
この新しいモデルは、どんな種類の分子との特定の相互作用を調整することで、所望の機能を持つタンパク質を設計するためのMLモデルの適用範囲を拡大し、それによってバイオテクノロジーや臨床応用に効果的に影響を与えることができるかもしれません。
DeepmindのAlphaFoldによって始まった構造生物学の革命の後、タンパク質設計と密接に関連する分野は、より最近、深層学習の力によって進歩の新しい時代に入りました。しかし、既存のタンパク質設計のための機械学習(ML)モデルは、非タンパク質エンティティを設計プロセスに組み込む能力に限界があり、タンパク質の成分のみを取り扱っています。私たちの新しいプレプリントでは、「CARBonAra」という新しいディープラーニングモデルを紹介し、タンパク質を取り囲むあらゆる種類の分子を考慮し、薬品様リガンド、補因子、基質、核酸、または他のタンパク質など、どんな種類の分子でも結合するタンパク質を設計できるようにしました。私たちが以前のMLモデルから幾何学的変換アーキテクチャを活用することで、CARBonAraは、あらゆる性質の分子によって課せられた制約を認識しながら、バックボーンスキャフォールドからタンパク質配列を予測します。この画期的なアプローチは、どんな種類の細胞構成要素との特定の相互作用を調整することで、所望の機能を持つタンパク質を設計するためのMLモデルの汎用性を拡大するのに役立つ可能性があります。
イントロダクション
データサイエンティストとして、私たちは常に可能性の限界を押し上げることを目指しています。プロテインデザイン、つまり所望の機能と特性を持つ新しいタンパク質の作成は、生物学や医学からバイオテクノロジー、材料科学まで、様々な分野に深い影響を与える分野の一つです。物理学に基づく方法は、与えられたタンパク質構造に折り畳まれるアミノ酸配列を見つけることで進歩を遂げてきましたが、深層学習技術はゲームチェンジャーとして登場し、設計の成功率と汎用性を大幅に向上させています。
ここで、私は最新の4つのMLモデルについて議論しました。
タンパク質設計の機械学習の時代は、4つの主要な方法でまとめられています
人工知能に基づくこれらの手法とツールのおかげで、タンパク質バイオテクノロジーにとってこれほどエキサイティングな時代はなかったでしょう
towardsdatascience.com
これらのモデルは多くのタンパク質設計タスクで成功を収めていますが、設計プロセス中に非タンパク質エンティティを考慮する能力に限界があり、その汎用性を制限し、適用範囲を狭めています。
この課題を克服するために、私たちは最新のプレプリントで、ターゲットタンパク質スキャフォールドと相互作用するあらゆる種類の分子を受け入れることで、プロテインシーケンスデザインを革新するCARBonAraという新しいモデルを提案しています。以下がプレプリントです。
タンパク質シーケンスデザインのためのコンテキストに関する幾何学的ディープラーニング
タンパク質設計とエンジニアリングは、深層学習の進歩を活用して前例のない速度で進化しています。現在…
www.biorxiv.org
CARBonAraは、私たちのProtein Structure Transformer(PeSTo)に基づいて構築されています。PeSToは、分子を原子タイプに関係なく操作し、元素名で直接表現する原子点群で動作する幾何学的変換アーキテクチャです。以前にPeSToについて詳細に説明しました:
新しいプレプリントが、原子座標の新しいパラメーターフリー幾何学的変換器を説明しています…
そして、それは非常に速く実行できるため、大量のタンパク質構造をスキャンして相互作用しやすいアミノ酸を検索することさえできます。
towardsdatascience.com
CARBonAraのコアはPeSToモデルに基づいており、核酸、リピド、イオン、小さなリガンド、補因子、またはその他のタンパク質を含む任意の種類の非タンパク質分子を設計するプロセスに組み込むことができます。したがって、相互作用距離内に1つ以上のリガンドを含む入力タンパク質構造が与えられた場合、CARBonAraはバックボーンスキャフォールドに伴う非タンパク質分子の入力を受け取り、最大値からアミノ酸信頼度を予測し、タンパク質配列を再構築できます。これにより、特定の機能または構造要件(たとえば、特定のアミノ酸を固定するなど、特定の機能に必要な場合)によってさらに制約できる、潜在的なシーケンスの空間が生成されます。CARBonAraは、タンパク質の周囲の分子状況を考慮することで、イオン、基質、核酸、リピド、他のタンパク質などに特化した領域を作成できるため、タンパク質設計において前例のない柔軟性と深さを提供します。
私たちの評価では、CARBonAraはProteinMPNNやESM-IF1などの最新の方法と同等のパフォーマンスを発揮し、同様の計算効率を示します。モデルは、タンパク質単量体およびタンパク質複合体の設計に対してProteinMPNNおよびESM-IF1と同様のシーケンス回復率を実現しますが、その上に、他の方法が扱えない非タンパク質分子を含むタンパク質設計を扱うことができます。
CARBonAraの注目すべき特徴の1つは、さまざまな制約を組み込むことで特定の目標に合わせたシーケンスを調整できる能力です。たとえば、シーケンス同一性を最適化したり、類似性を最小化したり、類似性が低いシーケンスを実現したりすることができます。さらに、分子動力学シミュレーションからの構造的軌跡をCARBonAraと組み合わせることで、以前の方法では成功率が低かった場合に特にシーケンス回復率を改善できることがわかりました。
特にMLアーキテクチャの詳細については、bioRxivのプレプリントをチェックしてください:
タンパク質配列設計のためのコンテキスト感知型幾何学的深層学習
タンパク質の設計とエンジニアリングは、深層学習の進歩を活用して前例のないペースで進化しています。現在…
www.biorxiv.org
構造生物学のAIに関する関連記事
AlphaFold 2の1年以上にわたる無料利用と、生物学に引き起こした革命
タンパク質構造の自信を持ったモデリング、他の生体分子との相互作用の予測、そして…
VoAGI.com
JavaScript、ESMFoldで作成されたコンセンサス方法を使用した安定したタンパク質を設計するWebアプリ
最もシンプルなアプリケーションを実装するために、現代のテクノロジーとツールをブレンドして効率的な作業を実現する
javascript.plainenglish.io
科学における機械学習方法の量と品質のバランス
適切な検証と良好なデータセット、客観的でバランスの取れた予測が現実的に役立つようにする必要性について…
towardsdatascience.com
巨大なタンパク質言語モデルが構造生物学を変革する方法
AlphaFoldと同様の精度で構造予測を行い、最大60倍高速化 – そして新しいAI手法を開発する…
towardsdatascience.com
www.lucianoabriata.com 私は自然、科学、技術、プログラミングなど、幅広い関心事について執筆および撮影しています。
ここでチップを投げる または VoAGIメンバーになってすべてのストーリーにアクセスしてください(あなたに費用はかかりません)。 新しいストーリーをメールで受け取るために 購読する 。 小さな仕事については、こちらのサービスページで相談してください。 こちらからお問い合わせください 。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- TRACE(トレース)に会おう:グローバル座標トラッキングを使用した正確な3D人体姿勢および形状推定のための新しいAIアプローチ
- 予測の作成:Pythonにおける線形回帰の初心者ガイド
- PyTorchを使った転移学習の実践ガイド
- ChatGPTのバイアスを解消するバックパック:バックパック言語モデルはトランスフォーマーの代替AI手法です
- DeepMindのAIマスターゲーマー:2時間で26のゲームを学習
- 単一モダリティとの友情は終わりました – 今やマルチモダリティが私の親友です:CoDiは、合成可能な拡散による任意から任意への生成を実現できるAIモデルです
- AWSが開発した目的に特化したアクセラレータを使用することで、機械学習ワークロードのエネルギー消費を最大90%削減できます