DeepMind 发布了 AlphaGenome,这是一个新的人工智能工具,旨在更全面、准确地预测人类 DNA 序列中单变异或突变对广泛基因调控生物过程的影响。该模型的技术进步使其能够处理长 DNA 序列并输出高分辨率预测。AlphaGenome 模型以长达 100 万碱基对的 DNA 序列作为输入,预测数千个表征其调控活性的分子属性。它还可以通过比较突变序列与未突变序列的预测来评分遗传变异或突变的影响。预测属性包括不同细胞类型和组织中基因的起始和结束位置、剪接位置、产生的 RNA 量,以及哪些 DNA 碱基可访问、彼此接近或与特定蛋白质结合。训练数据来源于大型公共联盟,如 ENCODE、GTEx、4D Nucleome 和 FANTOM5,这些联盟通过实验测量了数百种人类和小鼠细胞类型和组织中基因调控重要模态的属性。AlphaGenome 架构使用卷积层初步检测基因组序列中的短模式,使用变换器在序列所有位置间传递信息,并使用最终一系列层将检测到的模式转化为不同模态的预测。在训练期间,单个序列的计算分布在多个互连的 Tensor Processing Units(TPUs)上。该模型基于 DeepMind 之前的基因组学模型 Enformer,并与专注于分类蛋白质编码区域内变异效应的 AlphaMissense 互补。AlphaGenome 已通过 AlphaGenome API 提供预览,供非商业研究使用,并计划未来发布模型。