[谷歌] 历史性一刻!人类基因密码被谷歌AI破解

1月29日凌晨,2024年诺贝尔化学奖得主、谷歌DeepMind CEO Demis Hassabis带领团队研发的AI基因组模型——AlphaGenome,登上了顶级期刊Nature(自然)最新一期封面。这是继AlphaFold之后,DeepMind又一项重磅生命科学研究登上Nature。


AlphaGenome旨在解决生物学中一个长期未解的难题:人类基因组中约98%的非编码区域虽然不直接产生蛋白质,却调控着基因的开启、剪接与表达,其变异常常与疾病风险密切相关,但难以用传统手段解析。

为此,DeepMind研究团队构建了一个全新AI架构,可输入百万碱基长度的DNA序列,并以单碱基分辨率,预测RNA表达量、剪接结构、染色质可及性、转录因子结合位点乃至三维结构等近6000项调控特征。

该项目论文题为《Advancing regulatory variant effect prediction with AlphaGenome(借助AlphaGenome技术提升调控变异的效应预测能力)》,也是首次有AI模型实现了对人类基因调控“从序列到功能”的统一建模。

过去40亿年积淀的生命遗传密码,如今正被AI工具以“统一建模”的方式重新解码。

DeepMind在2025年6月曾通过博客预告此项目,彼时AlphaGenome已向科研界开放预览API,重点在于构建一个更具解释力和泛化能力的DNA序列模型,作为一种“通用型变异解读引擎”投入研究使用。

此次正式发表在Nature的版本中,DeepMind团队不仅完成了全模态性能评估,更在多个疾病变异机制中展示了AlphaGenome的推理能力,包括如何准确预测TAL1致癌突变的激活机制,全面验证了AlphaGenome在剪接、表达、染色质状态等关键通路上的预测能力。





研究者认为,这一模型将为罕见病致因定位、新型治疗靶点发掘、以及合成生物学设计等方向提供强有力的通用工具。

论文链接:https://www.nature.com/articles/s41586-025-10014-0

百万级DNA输入和碱基级预测


突破“长序列”与“高分辨率”难题

AlphaGenome的核心创新之一,是首次将输入DNA序列长度提升至100万碱基(1Mb),同时在输出层保持了碱基级别的预测精度。

这打破了以往模型在“长序列”与“高分辨率”之间的权衡。例如,以往的SpliceAI等模型虽然具备高分辨率,但受限于只能处理1万碱基以内的短序列,难以捕捉远距离调控。

而Enformer等模型虽能处理20万至50万碱基的长序列,却需牺牲精度,用128bp等为单位分箱预测,无法精准描摹剪接位点、增强子与启动子的细粒度结构。

在训练流程上,AlphaGenome采取了“预训练+蒸馏”的两阶段架构,通过多个TPU并行处理、序列平行化、U-Net结构和Transformer结合,既保留了细节,又扩大了上下文范围。

[物价飞涨的时候 这样省钱购物很爽]
好新闻没人评论怎么行,我来说几句
上一页123下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读 更多...
    为中国创业项目窃取AI技术,前谷歌工程师被定罪 为疾病寻新疗法 Google AI工具探索人类基因组奥秘
    突如其来,谷歌重拳封杀这家中企 谷歌正在大量招收无大学学历人才
    谷歌DeepMind CEO:中国AI公司落后大约6个月 谷歌前CEO:欧洲不投钱,就只能用中国的AI模型喽
    Gemini太慢?Google全新按键AI 秒回答 苹果谷歌一起做"混血Siri",为何马斯克在线怒喷?
    Google量子电脑 中国"祖冲之3.0"的劲敌? 黄仁勋挖角谷歌资深高管 英伟达任命首位CMO
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)

    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站