Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_308e2df3f4232ad08e1c5ca6c7314ec4, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
谷歌AlphaGenome橫空出世:揭示DNA天書 | 溫哥華教育中心
   

[谷歌] 谷歌AlphaGenome橫空出世:揭示DNA天書

這款模型的預測范圍非常廣泛,包括了在不同的細胞類型和組織中,基因的起始與終止位點、基因的剪接位置、RNA的生成數量,以及哪些DNA鹼基是可訪問的、哪些在空間上相互靠近、哪些與特定的蛋白質結合等。


AlphaGenome能夠同時做出多方面的預測,得益於其頗具層次的核心架構。

如下圖所示,首先通過卷積層初步檢測基因組序列中的短模式,再利用Transformer架構在整個序列的任意位置之間高效傳遞信息。

最後,經由壹系列輸出層,將識別出的模式轉化為對不同調控維度的具體預測。



在訓練過程中,針對單個序列的龐大計算量,會被分散到多個互聯的張量處理單元(TPU)上協同完成。

模型基於谷歌先前的基因組學模型Enformer構建,並與AlphaMissense模型形成互補——後者專注於分類蛋白質編碼區內的變異所造成的影響。

順便提壹句,模型的訓練數據源自多個大型公共科研項目,如ENCODE、GTEx、4D Nucleome和FANTOM5。

這些項目通過實驗,測量並覆蓋了數百種人類及小鼠細胞與組織中基因調控的多種關鍵維度。

壹次100萬DNA鹼基,瞬間預測

與現有的DNA序列模型相比,AlphaGenome具備幾項顯著的獨特優勢:

兼顧長序列與高分辨率

處理長序列對於覆蓋遠距離的基因調控區至關重要,而鹼基級別的分辨率則是捕捉精細生物學細節的關鍵。

以往的模型不得不在序列長度和分辨率之間做出艱難取舍,這限制了它們能夠同時建模和准確預測的生物學維度。


而谷歌的技術突破成功克服了這壹限制,且並未顯著增加訓練所需的資源。

訓練壹個完整的AlphaGenome模型(未經蒸餾)僅需4小時,算力開銷僅為最初訓練Enformer模型時的壹半。

結果就是,AlphaGenome已經可以實現長達100萬個DNA鹼基字母的序列的分析,並能以單個鹼基的分辨率進行精細預測。



全面的多維度預測

通過解鎖對長輸入序列的高分辨率預測能力,AlphaGenome得以對迄今最多樣化的生物學維度進行預測。

這為科學家們提供了關於基因調控復雜過程的、更全面的信息。

[物價飛漲的時候 這樣省錢購物很爽]
還沒人說話啊,我想來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀 更多...
    谷歌員工聯署請願 要求CEO拒絕承接美軍機密業務 全球最大規模!Google部署"鐵空氣電池"
    Google地圖即將迎來大規模AI升級 Google首款無屏幕"智慧手環"曝光
    Google全新PC電腦設計首度曝光(圖 網友發現 Google地圖壹片紅通通 壹票人嚇壞
    谷歌拿出壓箱底技術,中國開源模型即將迎戰? 9分鍾內破解比特幣,谷歌拒絕公布技術細節
    砸崩全球存儲股後 谷歌再發"技術澄清" 谷歌再發"技術澄清",砸崩全球存儲股的論文陷爭議
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站