DeepSeek塞进苹果本儿分币不花实现"龙虾自由"

2026-05-10 | 来源: 钛媒体 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

在agent时代最贵的是什么？是token。

一些重度agent使用者，一个月用掉几亿token，账单小几万块钱也是常有的事。

然而现在开始，有这么一个开发者他开源了一个本地方案，一台苹果笔记本就能部署，也就是说，你从此实现了“龙虾自由”，跑再多任务，也不会再为token付出一分钱了。最关键的是，他用的还是DeeSeek V4 Falsh。

几天前，antirez在GitHub上发布了一个项目，叫ds4。

这是一个专门为DeepSeek V4 Flash写的推理引擎。一共几千行C代码，可以让DeepSeek V4 Flash这个模型在128G内存的苹果电脑上跑起来。

开发者antirez，本名Salvatore Sanfilippo，是意大利程序员，同时他也是开源数据库Redis的原作者。Redis后来成为全球互联网基础设施里最常用的内存数据库之一。

往好的方面去想，DeepSeek影响力足够大，吸引到了圈内顶流的程序员，但是坏的方面是，DeepSeek这回真的免费了。

任何开发者都可以用ds4，去把DeepSeek V4 Flash装进自己的MacBook Pro里，本地跑代码、本地读上下文、本地做agent任务，而这一切的一切，不需要给DeepSeek付1分钱。

虽然DeepSeek V4 Flash本身开源，可FP16精度的原始模型要吃掉284G内存，显存需求更是高达160G。

因此，想运行它，你至少得有两张英伟达A100 80GB、一条512GB DDR5 ECC内存，以及一个4TB NVMe SSD。总成本50万人民币(专题)。

而现在，一台3万块钱的MacBook Pro就能跑。

那antirez为什么偏偏选中DeepSeek V4 Flash呢？

原因是DeepSeek最适合被“塞进本地电脑”。

它有284B总参数，足够大；但每次推理只激活13B参数，又不像传统大模型那样沉重。

它支持100万token上下文，适合编程助手这种长任务；同时KV cache压缩得足够狠，给本地内存和SSD留下了操作空间。

DeepSeek V4 Flash刚好站在了这样一个神奇的平衡点上，既大到值得折腾，又小到能被塞进苹果笔记本里。

YC的CEO Garry Tan在X上转了这条消息，只打了一行字：正在下载……100万token上下文窗口，可用的编程助手能力，全在一台128GB的MacBook Pro上，太疯狂了。

ds4究竟是什么？

先说结论，ds4不是一个模型，它是一台“专用发动机”。DeepSeek V4 Flash是车，苹果电脑是路，ds4负责把这辆原本更适合跑在云端的大车，改到本地机器上能跑、能接API、还能被coding agent调用。

[加西网正招聘多名全职sales 待遇优] 这条新闻还没有人评论喔，等着您的高见呢

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

手机版本

专家专栏

新楼盘

当前会员

地产中文书籍