DeepSeek"日賺"56萬,"朋友圈"掀起算力戰

2025-03-04 | 來源: 硅基研究室 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

壹位不願透露姓名的服務器專家向「硅基研究室」表示，國產AI芯片現階段仍需要基於大模型做專門設計，例如“低精度高緩存”，加快支持FP8數據類型（DeepSeek采用了 FP8混合精度訓練），讓推理更加便宜的同時，也利於下游服務器廠商的設計。

在雲廠商及算力服務商側，在豪賭之外，需要算大模型的經濟賬——除了采購芯片外，數據中心建設還包括了能源配套、人力配套（運維、研發）和數據資產等成本支出。

除此以外，在大模型抵達最終訓練前，前期研究、所使用的數據訓練等各環節的試錯成本，以及人員薪酬等這些也都是總成本的壹部分，模型廠商並不會公開這些隱形成本。

因此，如何在算力建設的每壹環降低資源浪費，這既考驗大廠各家的Infra能力，也考驗自身的預期管理。

海外雲廠商的普遍做法有延長服務器折舊周期，與能源公司合作等手段，有的也及時止損。此前微軟就被曝出暫停了OpenAI計劃使用的威斯康星州人工智能數據中心的部分建設，原因是高估了部分地區的算力需求。

壹邊更合理地規劃資源，提升算力利用率。另壹邊，巧妙施展財技，保證利潤率水平，這也是後續雲廠商反應在基本面上的趨勢。具體到模型側，擁抱開源、持續優化算法，已經成為了當前各大廠商的階段共識。

與此同時，在應用側推動產品爆發、落地，也成為了廠商們拓展“算力故事”的重點。根據「硅基研究室」多方了解，C端的個人Agent、B端的企業私有化部署以及G端的政務公共智算雲，則是行業目前關注的叁大方向。

如果說，過去OpenAI掀起的是壹場算力游戲，那麼DeepSeek出圈後，這場游戲還將繼續，只不過它有了新的定語，這是壹場“算力效率”的游戲。

盡管壹度被砸掉6000億美金市值，黃仁勳還是多次對DeepSeek給予了正面評價，最新的財報電話會議中，他說：“感謝DeepSeek，它開源了壹個絕對世界級的推理模型。”

[加西網正招聘多名全職sales 待遇優] 還沒人說話啊，我想來說幾句

分享:

上壹頁 1 2 3 4 56下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

專家專欄

工具

當前會員

DeepSeek"日賺"56萬,"朋友圈"掀起算力戰

意見