「NYUの研究者たちはゲノミクスのためのニューラルネットワークを作成し、それが予測にどのように辿り着くかを説明できることを示しました」

「NYU研究者のゲノミクスに関するニューラルネットワークが予測の背後に込められた仕組みを解明!」

生物学的研究领域中,机器学习模型正在在推动我们对复杂过程的理解方面取得重要进展,尤其是在RNA剪接方面。然而,这个领域许多机器学习模型的共同局限是它们缺乏可解释性-它们可以准确地预测结果,但很难解释其预测结果的形成过程。

为了解决这个问题,纽约大学的研究人员提出了一种“按设计可解释”的方法,不仅确保准确的预测结果,而且还提供对基础生物过程(特别是RNA剪接)的深入洞察。这种创新的模型有潜力显著增强我们对这个基本过程的理解。

神经网络等机器学习模型在生物科学的科学发现和实验设计方面发挥了重要作用。然而,它们的不可解释性一直是一个持久的挑战。尽管它们具有高准确度,但通常无法阐明其预测背后的原因。

新的“按设计可解释”方法通过创建一个明确设计为可解释的神经网络模型来克服这个局限,同时保持与最先进模型相当的预测准确度。这种方法在该领域是一个突破性的改进,它弥合了准确性与可解释性之间的差距,确保研究人员不仅具有正确的答案,而且还能理解这些答案是如何得出的。

该模型经过仔细训练,并强调可解释性,使用了Python 3.8和TensorFlow 2.6。对各种超参数进行了调整,并在训练过程中逐步引入可学习参数。通过引入正则化项,进一步增强了模型的可解释性,确保学到的特征简明易懂。

该模型的一个显著特点是它能够推广并在来自不同来源的各种数据集上进行准确预测,突显了其稳健性和捕捉剪接调控逻辑重要方面的潜力。这意味着它可以应用于不同的生物环境,为不同的RNA剪接情景提供有价值的洞察。

该模型的架构包括序列和结构过滤器,这对于理解RNA剪接至关重要。重要的是,它为这些过滤器分配了定量的强度,揭示了它们对剪接结果的影响程度。通过一种名为“平衡图”的可视化工具,研究人员可以探索并量化多个RNA特征对个体外显子的剪接结果的贡献。这个工具简化了对剪接过程中各种特征相互作用的理解。

此外,该模型不仅验证了之前已建立的RNA剪接特征,而且还发现了与茎环结构和低G序列相关的两个未经表征的外显子跳跃特征。这些发现具有重要意义,并经过了实验验证,从而增强了该模型的可信度以及这些特征的生物学相关性。

总之,“按设计可解释”的机器学习模型在生物科学中代表了一个强大的工具。它不仅具有高预测准确度,还对RNA剪接过程提供了清晰可解释的理解。该模型能够量化特定特征对剪接结果的贡献,具有在医学和生物技术领域的多个应用的潜力,从基因组编辑到RNA基因药物的开发。这种方法不仅局限于剪接,还可以应用于解析其他复杂的生物过程,为科学发现开辟新的道路。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

『トランスフォーマーの位置符号化の解説』

元のトランスフォーマーアーキテクチャでは、位置エンコーディングが入力と出力の埋め込みに追加されました位置エンコーディ...

データサイエンス

DLノート:勾配降下法

人工ニューラルネットワーク(ANN)は、万能関数近似器です十分なデータが与えられ、適切なアーキテクチャがあり、十分な訓練...

データサイエンス

「AGIに向かって:LLMと基礎モデルが人生の学びの革命で果たす役割」

過去10年間、特にディープラーニングの成功を受けて、人工汎用知能(AGI)の構築の可能性について議論が続いています最終目標...

機械学習

スカイワーク-13B:3.2Tトークン以上のコーパスから学習された大規模言語モデル(LLM)のファミリーを紹介しますこのコーパスは、英語と中国語のテキストから引用されています

バイリンガルLLMは、言語の多様性が共通の課題となっている相互につながった世界で、ますます重要になっています。彼らは言語...

機械学習

「読むアバター:リアルな感情制御可能な音声駆動のアバター」

「既存の音声駆動型のディープフェイクの重要な制約の1つは、スタイル属性をより制御できる能力の必要性です理想的には、これ...