DeepSeek塞進蘋果本兒 分幣不花實現"龍蝦自由"

在agent時代最貴的是什麼?是token。
壹些重度agent使用者,壹個月用掉幾億token,賬單小幾萬塊錢也是常有的事。
然而現在開始,有這麼壹個開發者他開源了壹個本地方案,壹台蘋果筆記本就能部署,也就是說,你從此實現了“龍蝦自由”,跑再多任務,也不會再為token付出壹分錢了。最關鍵的是,他用的還是DeeSeek V4 Falsh。
幾天前,antirez在GitHub上發布了壹個項目,叫ds4。
這是壹個專門為DeepSeek V4 Flash寫的推理引擎。壹共幾千行C代碼,可以讓DeepSeek V4 Flash這個模型在128G內存的蘋果電腦上跑起來。
開發者antirez,本名Salvatore Sanfilippo,是意大利程序員,同時他也是開源數據庫Redis的原作者。Redis後來成為全球互聯網基礎設施裡最常用的內存數據庫之壹。
往好的方面去想,DeepSeek影響力足夠大,吸引到了圈內頂流的程序員,但是壞的方面是,DeepSeek這回真的免費了。
任何開發者都可以用ds4,去把DeepSeek V4 Flash裝進自己的MacBook Pro裡,本地跑代碼、本地讀上下文、本地做agent任務,而這壹切的壹切,不需要給DeepSeek付1分錢。
雖然DeepSeek V4 Flash本身開源,可FP16精度的原始模型要吃掉284G內存,顯存需求更是高達160G。
因此,想運行它,你至少得有兩張英偉達A100 80GB、壹條512GB DDR5 ECC內存,以及壹個4TB NVMe SSD。總成本50萬人民幣(专题)。
而現在,壹台3萬塊錢的MacBook Pro就能跑。
那antirez為什麼偏偏選中DeepSeek V4 Flash呢?
原因是DeepSeek最適合被“塞進本地電腦”。
它有284B總參數,足夠大;但每次推理只激活13B參數,又不像傳統大模型那樣沉重。
它支持100萬token上下文,適合編程助手這種長任務;同時KV cache壓縮得足夠狠,給本地內存和SSD留下了操作空間。
DeepSeek V4 Flash剛好站在了這樣壹個神奇的平衡點上,既大到值得折騰,又小到能被塞進蘋果筆記本裡。

YC的CEO Garry Tan在X上轉了這條消息,只打了壹行字:正在下載……100萬token上下文窗口,可用的編程助手能力,全在壹台128GB的MacBook Pro上,太瘋狂了。
ds4究竟是什麼?
先說結論,ds4不是壹個模型,它是壹台“專用發動機”。DeepSeek V4 Flash是車,蘋果電腦是路,ds4負責把這輛原本更適合跑在雲端的大車,改到本地機器上能跑、能接API、還能被coding agent調用。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:



