[谷歌] 歷史性壹刻!人類基因密碼被谷歌AI破解

AlphaGenome模型架構、訓練方案和綜合評估性能
在跨24項基因組軌跡任務中,AlphaGenome在22項上超越當前最佳模型;在26項變異效應預測中,有25項達到或超過當前SOTA模型的表現。

研究團隊基因組軌道上的預測性能進行了逐項評估
統壹預測機制
變異影響“壹鍵總覽”
與傳統模型需要分別針對不同任務(如剪接、表達、染色質結構)訓練不同網絡不同,AlphaGenome是第壹個可在單次推理中同時輸出11類模態(modality)預測結果的統壹模型。
它支持從壹段DNA序列中,直接推斷出RNA表達水平、剪接位點及使用情況、染色質可達性、轉錄因子結合位點、組蛋白修飾模式、叁維接觸圖譜等調控特征,且適用於人類與小鼠細胞在數千種不同細胞或組織類型中的表現。
這種“多模態聯合”結構為突變解析帶來了全新視角。
研究人員可以對任意壹個DNA變異,通過模型快速預測它在多個調控層級的影響,並比較參考與突變版本的差異,進而推斷該變異是否會導致表達上調、剪接改變,或染色質狀態變化。
論文中特別展示了模型如何成功預測致癌突變激活TAL1基因的路徑機制,驗證了其在非編碼區變異解釋中的實際價值。

AlphaGenome對T-ALL中TAL1致癌突變的多模態預測示例
剪接預測能力升級
有望推動罕見病研究
RNA剪接異常是諸多罕見病(如脊髓性肌萎縮症、囊性纖維化)的致病根源,但傳統AI模型往往只能識別剪接位點本身,而難以全面解析剪接使用率及剪接連接模式(splice junction)。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦: