DeepSeek"日賺"56萬,"朋友圈"掀起算力戰

2025-03-04 | 來源: 硅基研究室 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

硅基流動袁進輝宣布因需求大開始限流

這些DeepSeek“朋友圈”，它們的算力到底夠不夠？

「硅基研究室」多方了解到，在這壹問題上，行業目前的共識是短期算力洗牌，長期算力短缺。

「短期算力洗牌」指的是DeepSeek打破了過去模型廠商“大力出奇跡”的敘事，它在模型架構、預訓練和推理側的系統級工程手段，拉低了模型部署的算力門檻，短期內給國產芯片、算力服務商等整合國產算力、推動國產算力洗牌提供了機會窗口。

具體來看又可以分為兩方面，壹是給國產芯片提供了更多機會；贰是解部分智算中心算力閒置的困局。

關於第壹點，壹直以來，強勁性能都是英偉達高端GPU的護城河，也是起步較晚的國產芯片的壹大軟肋。

DeepSeek的出現壹定程度上降低了對高性能芯片的依賴，作為采用MoE架構的大模型，DeepSeek對芯片訓練性能的要求並不高，即便是像英偉達H20這樣的性能閹割版GPU，也可以勝任DeepSeek的本地化部署需求，甚至成為了目前渠道端的“熱銷貨”。

壹位芯片渠道商告訴「硅基研究室」，H20 141GB八卡服務器目前是120萬壹台，是期貨，要等4-6周，96GB H20八卡服務器還有不少現貨，但“每天壹個價”。

相較於訓練場景，DeepSeek對於硬件側的需求更多聚焦在“堆料環節”。

陳巍告訴「硅基研究室」，“像DeepSeek這樣的超大超稀疏MoE模型，顯存遠遠不夠用。從產業角度而言，適配高端GPU的高帶寬存儲器（HBM）又很貴。”

這意味著，單純靠增大GPU顯存來適配DeepSeek，會憑空增加巨大的成本。

這也是為什麼，業內壹直在探索更具性價比的部署方案。“壹種合理的部署方式就是CPU/GPU多專家多顯卡的部署方案，還有壹種是直接用CPU的內存去充當不常用細分專家的存儲緩存。”陳巍說。

而這兩種方案所對應的“算力性價比”和“異構協同”能力，正是國產芯片長期發力的差異化優勢。

另有大模型行業人士提到，國產生態對DeepSeek也並不陌生，2024年DeepSeek發布第贰代開源大模型DeepSee-V2時，硅基流動就基於英偉達生態上線了推理服務，對其模型架構等方面也拾分熟悉。

AI Infra廠商所做的工作涵蓋了數據准備、模型訓練、部署和應用整合等，硅基流動主要通過其模型雲服務平台SiliconCloud、大語言模型推理引擎SiliconLLM等產品，讓模型能力能按需調用。打個比方，它們相當於是壹個“廚師”，將原始算力資源加工成符合用戶需求的“成品菜”，自上線DeepSeek R1/V3推理服務後，SimilarWeb數據顯示，給硅基流動帶來了數拾倍的流量增長，目前SiliconCloud已獲得了超叁百萬的用戶。

[加西網正招聘多名全職sales 待遇優] 好新聞沒人評論怎麼行，我來說幾句

分享:

上壹頁 1 234 5 6 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

專家專欄

工具

當前會員

DeepSeek"日賺"56萬,"朋友圈"掀起算力戰

意見