DeepMind 发布 AlphaGenome AI 模型,提升基因组变异效应预测

1 天前·来源:DeepMind Blog
DeepMindAlphaGenome基因组学AI模型生物信息学

DeepMind 推出了 AlphaGenome AI 工具,用于预测人类 DNA 序列中单变异对基因调控过程的影响。该模型能处理长达 100 万碱基对的 DNA 序列,并输出高分辨率预测。AlphaGenome 已通过 API 提供预览,供非商业研究使用。

DeepMind 发布了 AlphaGenome,这是一个新的人工智能工具,旨在更全面、准确地预测人类 DNA 序列中单变异或突变对广泛基因调控生物过程的影响。该模型的技术进步使其能够处理长 DNA 序列并输出高分辨率预测。AlphaGenome 模型以长达 100 万碱基对的 DNA 序列作为输入,预测数千个表征其调控活性的分子属性。它还可以通过比较突变序列与未突变序列的预测来评分遗传变异或突变的影响。预测属性包括不同细胞类型和组织中基因的起始和结束位置、剪接位置、产生的 RNA 量,以及哪些 DNA 碱基可访问、彼此接近或与特定蛋白质结合。训练数据来源于大型公共联盟,如 ENCODE、GTEx、4D Nucleome 和 FANTOM5,这些联盟通过实验测量了数百种人类和小鼠细胞类型和组织中基因调控重要模态的属性。AlphaGenome 架构使用卷积层初步检测基因组序列中的短模式,使用变换器在序列所有位置间传递信息,并使用最终一系列层将检测到的模式转化为不同模态的预测。在训练期间,单个序列的计算分布在多个互连的 Tensor Processing Units(TPUs)上。该模型基于 DeepMind 之前的基因组学模型 Enformer,并与专注于分类蛋白质编码区域内变异效应的 AlphaMissense 互补。AlphaGenome 已通过 AlphaGenome API 提供预览,供非商业研究使用,并计划未来发布模型。

背景阅读

基因组是生物的遗传指令集,包含 DNA 序列,指导生物的外观、功能、生长和繁殖等几乎所有方面。DNA 序列中的小变异可能改变生物对环境响应或疾病易感性,但理解基因组指令在分子水平如何解读以及 DNA 变异的影响仍是生物学重大挑战。AI 在基因组学领域的应用日益重要,DeepMind 此前已开发 Enformer 模型用于基因表达预测,以及 AlphaMissense 模型用于蛋白质编码区域变异分类。这些模型利用深度学习技术,如卷积神经网络和变换器,处理大规模基因组数据,帮助科学家解析基因功能、疾病机制和潜在治疗靶点。AlphaGenome 的推出进一步扩展了 AI 在非编码区域(占基因组 98%)的应用,这些区域对基因活动调控至关重要,并与许多疾病相关。通过整合多模态数据和先进架构,AlphaGenome 有望推动基因组功能理解和生物医学研究。

评论 (0)

登录后参与评论

加载评论中...