Warning: mb_substr(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1908

Warning: mb_strlen(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1909

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1911

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1914
DeepSeek怎么赚钱?梁文峰的10万亿美元战略 | 温哥华教育中心
   

DeepSeek怎么赚钱?梁文峰的10万亿美元战略

我们先来做点有趣的 KV 缓存数学题。别担心,如果你讨厌数学,我们也只是用最近发布的 KV 缓存计算器,来看看 DeepSeek V4 Pro 到底能省下多少 KV 缓存,并把它跟最新的智谱 GLM 和阿里通义千问(Qwen)模型做个对比。


我以 100 万(1M)上下文长度为例进行计算,假设 KV 精度为 8 位(8-bit),索引器精度为 16 位(16-bit)。你自己也可以去这个网站上玩玩:https://kvcache.ai/tools/kv-cache-calculator/



在 100 万上下文深度下:

DeepSeek V4 居然只需要 5.48 GB 的高带宽内存(HBM, High Bandwidth Memory,一种常用于顶尖 AI 显卡的高速显存)。

GLM5 需要 60 GB 的 HBM。

Qwen3-235B-A22B 则需要高达 89 GB 的显存!

请注意,这还是在以下前提下:

DeepSeek 是一个拥有 1.6 万亿(1.6T)参数的巨无霸模型。

GLM5 大约是 7000 亿(700B)参数,而且它已经借鉴了 DeepSeek 的 MLA 和 DSA 技术,只是还没用上最新的压缩注意力机制。

Qwen3-235B-A22B 只有 2350 亿参数,使用的是相对传统的 GQA(分组查询注意力机制)。

DeepSeek 在缓解显存压力方面做出了奠基性的贡献。如果这项创新被行业广泛采纳,将让那些需要处理超长任务的长程 AI 智能体(Long-horizon Agents)成本低到难以置信,从而彻底解锁下一代崭新的应用场景。




疯狂背后的精密章法

能够在完全不牺牲模型质量的前提下,把 KV 缓存压缩得如此之小,正是他们敢把长时缓存(Long-held Cache)价格压到白菜价的底气所在——其价格甚至不到 Anthropic 旗下 Claude Sonnet 4.6 缓存命中价格的 3%,而且他们还能帮你免费保留好几个小时!

对于长程任务来说,由于缓存体量极小,将其“转存”(Offloading)到固态硬盘(SSD)并在需要时重新加载,就变得极为划算。这就大大降低了对 HBM 的依赖。要知道,HBM 目前全球严重短缺,而且从中国 AI 硬件产业的角度来看,这也是制造难度极高的核心痛点。更绝的是,DeepSeek 还开发了一套能从 SSD 中以极高速度重新加载 KV 缓存的技术,具体细节都在他们的论文里:https://arxiv.org/pdf/2602.21548



[加西网正招聘多名全职sales 待遇优]
已经有 3 人参与评论了, 我也来说几句吧
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
     延伸阅读
    华为"韬定律"刷屏:中国芯片迎来"DeepSeek时刻"了? DeepSeek塞进苹果本儿 分币不花实现"龙虾自由"
    消息称DeepSeek拟融资500亿元,梁文锋或参与出资 冲刺$500亿估值!中国国家基金拟投资DeepSeek
    DeepSeek V4 引爆需求:华为升腾950芯片遭疯抢 DeepSeek V4 与中共 AI 神话的崩解
    DeepSeek发表新AI模型 路透:市场反应冷淡 DeepSeek价格暴降90%!百万token仅2分钱
    偷用英伟达AI芯片? DeepSeek新模型V4曝光 DeepSeek V4炸场背后:有人在内斗,有人在接力
     推荐:

    comments

    当前评论
    评论1 游客 [爱.能.外.箸] 2026-05-25 03:21
    10万亿美元?蛋糕有那么大?咋不说60万亿,全球60亿人平均每人给他贡献1万美元?反正傻货们不会算账,吹呗!
    发表评论
    您的评论 *: 
    Security Code *:  Please input the number which is shown on the right picture
    The Captcha image  (Please input the number which is shown on the right picture)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站