DeepSeek塞进苹果本儿分币不花实现"龙虾自由"

2026-05-10 | 来源: 钛媒体 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

在M3 Max 128GB的MacBook Pro上，实测速度是每秒能生成26个字左右。M3 Ultra 512GB的Mac Studio上能跑到每秒36个字。

不算快，但写代码、调试这些日常工作完全够用。

更有意思的是，antirez是独自一人通过GPT-5.5完成的整个这个项目。

利好DeepSeek

根据外媒报道，DeepSeek目前正在寻求高达73.5亿美元的融资，梁文锋现在就处在这个关键的转折点上，用商业叙事取代DeepSeek过往的技术叙事。

那投资人看什么？不只是看模型跑分，不只是看API调用量，更看生态位和不可替代性。

一个海外知名开发大佬，愿意为你的模型写专用引擎，这本身就说明DeepSeek在海外有着一定的生态地位。

过去一年，中国开源模型的出海叙事里，主流衡量标准是benchmark，MMLU、HumanEval、SWE-bench，一串又一串的数字。

但有人愿意围绕你做二次工程，才代表你的模型被认可了。Anthropic用千问做实验，Cursor蒸馏Kimi，这种认可比分数更值钱。

antirez不是AI圈里那种什么新模型都要试一遍的博主

他选一个模型，然后还要花几周的时间去写专用推理引擎、做特制量化、搭HTTP服务层、做agent集成测试，显然是他认为DeepSeek值得。

这就变相等于，一个有信誉的第三方，在用自己的时间和名声给DeepSeek-V4背书。

说到国产模型出海，目前我能想到的路有两条。

一条是API被调用。你提供服务，别人付费使用，你是service provider，客户是consumer。

这条路很直接，也很现实，别人可以随时切换，你无时无刻都得对抗你的竞品，从性能到价格。

另一条是模型被改造。有人把你的权重拿走，做量化、做蒸馏、做专用runtime、做本地部署、做agent工具链。在这条路里，你的模型成了材料。

材料和服务的区别在于，材料会被嵌入到别人的工具链里，然后就很难被换掉了。

举个例子，某个开发者把ds4集成到自己的coding agent里，写了一堆配置文件、调试脚本、自动化流程。他的团队成员也都习惯了这套工具，公司的代码库里到处都是基于DeepSeek本地推理的调用。

这时候如果要换成别的模型，就不是“改个API key”那么简单了，而是要重新适配引擎、重写脚本、重新培训团队习惯。成本太高，大概率就不换了。

这就是“被嵌入”的粘性。

ds4把DeepSeek V4 Flash嵌进了Metal原生本地推理这个场景。截至发稿，Hugging Face上antirez那个deepseek-v4-gguf仓库，就已经有25000次下载了。

每一次下载，都意味着有人在自己的机器上跑起了DeepSeek，粘性也就这么一点一点的建立起来了。

更值得注意的是连锁效应。

Hacker News上有这样一条高赞评论，他说如果以后针对精确的GPU加模型组合构建超优化推理引擎会怎样？GPU越来越贵，抽象层去掉得越多，优化空间就越大。

这个方向一旦被验证，意味着每一代有分量的开源模型发布时，都会有人跳出来给它做专属引擎、专属量化、专属agent接入。

[物价飞涨的时候这样省钱购物很爽] 无评论不新闻，发表一下您的意见吧

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

手机版本

专家专栏

新楼盘

当前会员

地产中文书籍