「NYUの研究者たちはゲノミクスのためのニューラルネットワークを作成し、それが予測にどのように辿り着くかを説明できることを示しました」

「NYU研究者のゲノミクスに関するニューラルネットワークが予測の背後に込められた仕組みを解明!」

生物学的研究领域中,机器学习模型正在在推动我们对复杂过程的理解方面取得重要进展,尤其是在RNA剪接方面。然而,这个领域许多机器学习模型的共同局限是它们缺乏可解释性-它们可以准确地预测结果,但很难解释其预测结果的形成过程。

为了解决这个问题,纽约大学的研究人员提出了一种“按设计可解释”的方法,不仅确保准确的预测结果,而且还提供对基础生物过程(特别是RNA剪接)的深入洞察。这种创新的模型有潜力显著增强我们对这个基本过程的理解。

神经网络等机器学习模型在生物科学的科学发现和实验设计方面发挥了重要作用。然而,它们的不可解释性一直是一个持久的挑战。尽管它们具有高准确度,但通常无法阐明其预测背后的原因。

新的“按设计可解释”方法通过创建一个明确设计为可解释的神经网络模型来克服这个局限,同时保持与最先进模型相当的预测准确度。这种方法在该领域是一个突破性的改进,它弥合了准确性与可解释性之间的差距,确保研究人员不仅具有正确的答案,而且还能理解这些答案是如何得出的。

该模型经过仔细训练,并强调可解释性,使用了Python 3.8和TensorFlow 2.6。对各种超参数进行了调整,并在训练过程中逐步引入可学习参数。通过引入正则化项,进一步增强了模型的可解释性,确保学到的特征简明易懂。

该模型的一个显著特点是它能够推广并在来自不同来源的各种数据集上进行准确预测,突显了其稳健性和捕捉剪接调控逻辑重要方面的潜力。这意味着它可以应用于不同的生物环境,为不同的RNA剪接情景提供有价值的洞察。

该模型的架构包括序列和结构过滤器,这对于理解RNA剪接至关重要。重要的是,它为这些过滤器分配了定量的强度,揭示了它们对剪接结果的影响程度。通过一种名为“平衡图”的可视化工具,研究人员可以探索并量化多个RNA特征对个体外显子的剪接结果的贡献。这个工具简化了对剪接过程中各种特征相互作用的理解。

此外,该模型不仅验证了之前已建立的RNA剪接特征,而且还发现了与茎环结构和低G序列相关的两个未经表征的外显子跳跃特征。这些发现具有重要意义,并经过了实验验证,从而增强了该模型的可信度以及这些特征的生物学相关性。

总之,“按设计可解释”的机器学习模型在生物科学中代表了一个强大的工具。它不仅具有高预测准确度,还对RNA剪接过程提供了清晰可解释的理解。该模型能够量化特定特征对剪接结果的贡献,具有在医学和生物技术领域的多个应用的潜力,从基因组编辑到RNA基因药物的开发。这种方法不仅局限于剪接,还可以应用于解析其他复杂的生物过程,为科学发现开辟新的道路。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

AI:大規模言語&ビジュアルモデル

この記事では、AIにおける大規模言語モデルと視覚モデルの重要性、それらの能力、潜在的なシナジー、データバイアスや倫理的...

データサイエンス

デコード Transformersを平易な英語で説明します

コード、数学、またはキー、クエリ、値の言及なし

機械学習

「コスト効率の高い高性能 AI 推論用の Amazon EC2 DL2q インスタンスが一般提供開始されました」

Qualcomm AIのA.K Royさんによるゲスト記事ですAmazon Elastic Compute Cloud(Amazon EC2)DL2qインスタンスは、Qualcomm AI...

AIニュース

中国の強力なNvidia AIチップの隠れた市場

深圳華強北電子區的繁華街道之中,一個高端 Nvidia AI 芯片的地下市場悄然興起。這個隱蔽的世界在出口限制和對這些尖端處理器...

データサイエンス

「Protopia AIによる企業LLMアクセラレーションの基盤データの保護」

この記事では、Protopia AIのStained Glass Transformを使用してデータを保護し、データ所有権とデータプライバシーの課題を...