Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_308e2df3f4232ad08e1c5ca6c7314ec4, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
DeepSeek"日賺"56萬,"朋友圈"掀起算力戰 | 溫哥華教育中心
   

DeepSeek"日賺"56萬,"朋友圈"掀起算力戰

壹位不願透露姓名的服務器專家向「硅基研究室」表示,國產AI芯片現階段仍需要基於大模型做專門設計,例如“低精度高緩存”,加快支持FP8數據類型(DeepSeek采用了 FP8混合精度訓練),讓推理更加便宜的同時,也利於下游服務器廠商的設計。


在雲廠商及算力服務商側,在豪賭之外,需要算大模型的經濟賬——除了采購芯片外,數據中心建設還包括了能源配套、人力配套(運維、研發)和數據資產等成本支出。

除此以外,在大模型抵達最終訓練前,前期研究、所使用的數據訓練等各環節的試錯成本,以及人員薪酬等這些也都是總成本的壹部分,模型廠商並不會公開這些隱形成本。

因此,如何在算力建設的每壹環降低資源浪費,這既考驗大廠各家的Infra能力,也考驗自身的預期管理。

海外雲廠商的普遍做法有延長服務器折舊周期,與能源公司合作等手段,有的也及時止損。此前微軟就被曝出暫停了OpenAI計劃使用的威斯康星州人工智能數據中心的部分建設,原因是高估了部分地區的算力需求。

壹邊更合理地規劃資源,提升算力利用率。另壹邊,巧妙施展財技,保證利潤率水平,這也是後續雲廠商反應在基本面上的趨勢。具體到模型側,擁抱開源、持續優化算法,已經成為了當前各大廠商的階段共識。


與此同時,在應用側推動產品爆發、落地,也成為了廠商們拓展“算力故事”的重點。根據「硅基研究室」多方了解,C端的個人Agent、B端的企業私有化部署以及G端的政務公共智算雲,則是行業目前關注的叁大方向。

如果說,過去OpenAI掀起的是壹場算力游戲,那麼DeepSeek出圈後,這場游戲還將繼續,只不過它有了新的定語,這是壹場“算力效率”的游戲。

盡管壹度被砸掉6000億美金市值,黃仁勳還是多次對DeepSeek給予了正面評價,最新的財報電話會議中,他說:“感謝DeepSeek,它開源了壹個絕對世界級的推理模型。”

[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句
上壹頁123456下壹頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站