DeepSeek"日賺"56萬,"朋友圈"掀起算力戰
壹位不願透露姓名的服務器專家向「硅基研究室」表示,國產AI芯片現階段仍需要基於大模型做專門設計,例如“低精度高緩存”,加快支持FP8數據類型(DeepSeek采用了 FP8混合精度訓練),讓推理更加便宜的同時,也利於下游服務器廠商的設計。
在雲廠商及算力服務商側,在豪賭之外,需要算大模型的經濟賬——除了采購芯片外,數據中心建設還包括了能源配套、人力配套(運維、研發)和數據資產等成本支出。
除此以外,在大模型抵達最終訓練前,前期研究、所使用的數據訓練等各環節的試錯成本,以及人員薪酬等這些也都是總成本的壹部分,模型廠商並不會公開這些隱形成本。
因此,如何在算力建設的每壹環降低資源浪費,這既考驗大廠各家的Infra能力,也考驗自身的預期管理。
海外雲廠商的普遍做法有延長服務器折舊周期,與能源公司合作等手段,有的也及時止損。此前微軟就被曝出暫停了OpenAI計劃使用的威斯康星州人工智能數據中心的部分建設,原因是高估了部分地區的算力需求。
壹邊更合理地規劃資源,提升算力利用率。另壹邊,巧妙施展財技,保證利潤率水平,這也是後續雲廠商反應在基本面上的趨勢。具體到模型側,擁抱開源、持續優化算法,已經成為了當前各大廠商的階段共識。
與此同時,在應用側推動產品爆發、落地,也成為了廠商們拓展“算力故事”的重點。根據「硅基研究室」多方了解,C端的個人Agent、B端的企業私有化部署以及G端的政務公共智算雲,則是行業目前關注的叁大方向。
如果說,過去OpenAI掀起的是壹場算力游戲,那麼DeepSeek出圈後,這場游戲還將繼續,只不過它有了新的定語,這是壹場“算力效率”的游戲。
盡管壹度被砸掉6000億美金市值,黃仁勳還是多次對DeepSeek給予了正面評價,最新的財報電話會議中,他說:“感謝DeepSeek,它開源了壹個絕對世界級的推理模型。”
[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句
在雲廠商及算力服務商側,在豪賭之外,需要算大模型的經濟賬——除了采購芯片外,數據中心建設還包括了能源配套、人力配套(運維、研發)和數據資產等成本支出。
除此以外,在大模型抵達最終訓練前,前期研究、所使用的數據訓練等各環節的試錯成本,以及人員薪酬等這些也都是總成本的壹部分,模型廠商並不會公開這些隱形成本。
因此,如何在算力建設的每壹環降低資源浪費,這既考驗大廠各家的Infra能力,也考驗自身的預期管理。
海外雲廠商的普遍做法有延長服務器折舊周期,與能源公司合作等手段,有的也及時止損。此前微軟就被曝出暫停了OpenAI計劃使用的威斯康星州人工智能數據中心的部分建設,原因是高估了部分地區的算力需求。
壹邊更合理地規劃資源,提升算力利用率。另壹邊,巧妙施展財技,保證利潤率水平,這也是後續雲廠商反應在基本面上的趨勢。具體到模型側,擁抱開源、持續優化算法,已經成為了當前各大廠商的階段共識。
與此同時,在應用側推動產品爆發、落地,也成為了廠商們拓展“算力故事”的重點。根據「硅基研究室」多方了解,C端的個人Agent、B端的企業私有化部署以及G端的政務公共智算雲,則是行業目前關注的叁大方向。
如果說,過去OpenAI掀起的是壹場算力游戲,那麼DeepSeek出圈後,這場游戲還將繼續,只不過它有了新的定語,這是壹場“算力效率”的游戲。
盡管壹度被砸掉6000億美金市值,黃仁勳還是多次對DeepSeek給予了正面評價,最新的財報電話會議中,他說:“感謝DeepSeek,它開源了壹個絕對世界級的推理模型。”
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:
DeepSeek"日賺"56萬,"朋友圈"掀起算力戰