Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_308e2df3f4232ad08e1c5ca6c7314ec4, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
DeepSeek"日賺"56萬,"朋友圈"掀起算力戰 | 溫哥華教育中心
   

DeepSeek"日賺"56萬,"朋友圈"掀起算力戰




硅基流動袁進輝宣布因需求大開始限流

這些DeepSeek“朋友圈”,它們的算力到底夠不夠?

「硅基研究室」多方了解到,在這壹問題上,行業目前的共識是短期算力洗牌,長期算力短缺。

「短期算力洗牌」指的是DeepSeek打破了過去模型廠商“大力出奇跡”的敘事,它在模型架構、預訓練和推理側的系統級工程手段,拉低了模型部署的算力門檻,短期內給國產芯片、算力服務商等整合國產算力、推動國產算力洗牌提供了機會窗口。

具體來看又可以分為兩方面,壹是給國產芯片提供了更多機會;贰是解部分智算中心算力閒置的困局。

關於第壹點,壹直以來,強勁性能都是英偉達高端GPU的護城河,也是起步較晚的國產芯片的壹大軟肋。

DeepSeek的出現壹定程度上降低了對高性能芯片的依賴,作為采用MoE架構的大模型,DeepSeek對芯片訓練性能的要求並不高,即便是像英偉達H20這樣的性能閹割版GPU,也可以勝任DeepSeek的本地化部署需求,甚至成為了目前渠道端的“熱銷貨”。

壹位芯片渠道商告訴「硅基研究室」,H20 141GB八卡服務器目前是120萬壹台,是期貨,要等4-6周,96GB H20八卡服務器還有不少現貨,但“每天壹個價”。

相較於訓練場景,DeepSeek對於硬件側的需求更多聚焦在“堆料環節”。

陳巍告訴「硅基研究室」,“像DeepSeek這樣的超大超稀疏MoE模型,顯存遠遠不夠用。從產業角度而言,適配高端GPU的高帶寬存儲器(HBM)又很貴。”

這意味著,單純靠增大GPU顯存來適配DeepSeek,會憑空增加巨大的成本。




這也是為什麼,業內壹直在探索更具性價比的部署方案。“壹種合理的部署方式就是CPU/GPU多專家多顯卡的部署方案,還有壹種是直接用CPU的內存去充當不常用細分專家的存儲緩存。”陳巍說。

而這兩種方案所對應的“算力性價比”和“異構協同”能力,正是國產芯片長期發力的差異化優勢。

另有大模型行業人士提到,國產生態對DeepSeek也並不陌生,2024年DeepSeek發布第贰代開源大模型DeepSee-V2時,硅基流動就基於英偉達生態上線了推理服務,對其模型架構等方面也拾分熟悉。

AI Infra廠商所做的工作涵蓋了數據准備、模型訓練、部署和應用整合等,硅基流動主要通過其模型雲服務平台SiliconCloud、大語言模型推理引擎SiliconLLM等產品,讓模型能力能按需調用。打個比方,它們相當於是壹個“廚師”,將原始算力資源加工成符合用戶需求的“成品菜”,自上線DeepSeek R1/V3推理服務後,SimilarWeb數據顯示,給硅基流動帶來了數拾倍的流量增長,目前SiliconCloud已獲得了超叁百萬的用戶。

[加西網正招聘多名全職sales 待遇優]
好新聞沒人評論怎麼行,我來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站