DeepSeek V4炸場背後:有人在內斗,有人在接力




當硅谷閉源陣營陷入“博弈”的內斗泥沼,中國大模型正在用另壹種方式撕開缺口。

4月24日,期待已久的DeepSeek-V4預覽版正式發布並同步開源,DeepSeek-V4分為Pro與Flash兩個版本,均支持百萬(1M)token超長上下文。同樣在這周,Kimi不約而同地發布了最新模型K2.6,把Agent能力從“單點調用”升級為“集群協同”。



壹周誕生了兩個萬億參數的開源模型,不僅讓全球開源領域的目光集體聚焦中國,更悄然勾勒出中美AI賽道截然不同的發展底色——當美國AI頭部企業陷入愈演愈烈的內斗,而中國的開源AI似乎已經跑通了壹條協同進化的道路。

01

同周開源,分工明確互不內卷

就在DeepSeek V4引發風暴的同壹周,月之暗面發布Kimi K2.6並開源,提升了Agent集群能力:支持300個Agent並行,可自主拆解和完成長周期的復雜工程任務。這與DeepSeek形成了鮮明的路線互補。



DeepSeek主攻“深度推理、長文本理解、算力效率”,Kimi猛攻“多Agent集群、長周期任務執行、復雜工程落地”,兩條路徑各自跑通閉環,共同擴大了中國開源模型的全球輻射范圍。


但是,兩家AI公司的這種“默契”真的是巧合嗎?

真正的細節藏在技術報告裡。

最典型的就是兩個關鍵技術的互相引用。

DeepSeek V3提出的MLA(多頭潛在注意力)技術,是它最核心的架構創新之壹,能通過壓縮KV緩存,大幅降低大模型的推理成本——要知道,推理成本是大模型落地的最大門檻之壹,MLA技術直接讓DeepSeek的推理效率提升壹個檔次。而Kimi在K2系列模型中,選擇沿用MLA架構,靠著這項技術,成功壓縮了KV緩存體積,為Agent能力的落地掃清了障礙。

[物價飛漲的時候 這樣省錢購物很爽]
還沒人說話啊,我想來說幾句
上壹頁12下壹頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀
    美國務院就DeepSeek等涉竊AI知識產權通告全球 價格屠夫DeepSeek新模型 定價僅OpenAI產品1%
    DeepSeek首次啟動融資,估值680億,圈裡已經炸了 前DeepSeek研究員入字節年薪近億?抖音副總裁回應
    DeepSeek向算力基建延伸 月薪3萬去內蒙"守機房" 月薪3萬,去內蒙草原給DeepSeek守機房
    DeepSeek因996成功?硅谷"中國焦慮"論的虛實 DeepSeek 新模型用華為芯片 舍棄英偉達
    連續"罷工"後編碼風格突變,DeepSeek大招來了? 重大事故!DeepSeek癱瘓超過8小時.....
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)

    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站