"所有人都在谈石油,但我觉得世界短缺的是Token
这里说的龙虾不是海鲜,是英文Long-bot的谐音梗,指代一类能长时间自主工作的AI智能体。它的核心能力就一条:你告诉它要做什么,它自己琢磨步骤、调用工具、处理意外、交付结果。过程中不需要你盯着屏幕。
听起来像科幻电影里的桥段。但龙虾类产品已经真实地涌入了市场。阿里一口气推出了两款,面向个人的JVSClaw和面向企业的悟空。字节、腾讯、月之暗面的类似产品也在密集上线。Anthropic的Claude Code更是点燃了程序员群体的热情,用AI写代码从一个辅助功能变成了全自动流水线。
龙虾的走红,彻底改写了算力消耗的方程式。
以前你用AI聊天,问一句答一句,单次对话消耗几百到几千Token,完事。龙虾不一样。你给它一个任务,它可能连续工作十分钟、半小时甚至更久。每一步推理、每一次工具调用、每一轮自我纠错,都在烧Token。一个简单的“帮我整理这周的工作报告”,龙虾可能需要打开邮箱、下载附件、阅读文档、提取要点、生成大纲、撰写正文、检查错别字、发送预览——整套流程下来,Token消耗是普通对话的几十倍。
更关键的是,龙虾让AI从一个“你主动找它”的工具,变成了“它替你守在那里”的同事。你可以睡前丢给它一个任务,它通宵干活,第二天早上交结果。这种使用场景意味着AI的运行时间从“偶尔”变成了“持续”。一个人如果认真用龙虾,一天的Token消耗轻松抵得上过去一个月。
需求曲线被狠狠向上掰了一截。
云服务商的反应很诚实。CoreWeave涨价超过20%。阿里云的GPU实例价格也在上浮。国内外多家云厂商开始对智能体类应用单独设置调用上限,或者在高峰时段限流。Anthropic宣布工作日上午5点到11点限制Token消耗量,用户一片哀嚎。有人在社交平台上写:“我这周45分钟就打穿了额度,以前几周都用不完。”
物理规律已经在收税。
普通人的算力账单:隐形分层已经开始
龙虾热把一个问题推到了台前:当算力变成稀缺资源,普通人怎么办?
表面上看,AI服务还在免费或低价。千问App、豆包、元宝、Claude免费版,都还能用。但“能用”和“够用”之间的距离正在拉大。
第一个变化是限流。你正在用龙虾处理一份重要文件,弹窗跳出来:“您已达到当前时段的使用上限,请稍后再试。”稍后是多久?可能是一个小时,可能是四个小时。你的工作节奏被打断了。这种打断不是技术故障,是算力配给的必然结果。云厂商把有限的资源优先分配给签了长约、付了高价的企业客户,个人用户免费或低价套餐的优先级自然靠后。
第二个变化是服务质量缩水。同样的提问,高峰期得到的回复可能更短、更浅、更敷衍。背后的原因很简单:模型在处理高并发请求时会自动“降级”,用更小的参数版本、更少的推理步数来节省算力。用户感知不到技术细节,但能感觉到“AI好像变笨了”。
第三个变化是付费门槛的实质性抬高。过去你觉得每月二十美元订阅费是“为效率买单”。以后这个价格买到的可能只是基础版,真正好用的龙虾功能需要加钱解锁。算力成本最终会沿着产业链向下传导,落在每个用户的账单上。
一种新的数字鸿沟正在成形。
它不像过去的“有没有网”“有没有智能机”那么显眼。它更隐蔽,但影响更深。一边是企业客户、高付费用户享受着接近无限的算力供给,龙虾可以通宵跑,任务可以并行开。另一边是普通用户面对着越来越频繁的“请稍后再试”,在算力配给的夹缝中精打细算。
有人会说,市场经济嘛,稀缺资源价高者得,天经地义。这个逻辑没错。但问题在于,AI正在从一个可有可无的新奇玩具,变成许多人的生产力工具、学习工具、创作工具。当一个工具开始影响人们的工作能力和收入潜力时,使用权的差异就不再只是消费选择的问题了。
想一想。未来某个岗位的招聘要求写着“熟练使用龙虾类工具”。应聘者A的公司配了企业版,算力管够,作品集精雕细琢。应聘者B自己掏钱用免费版,每天被限流三次,产出效率天然低一截。这种差距是因为算力配额。它会在不知不觉中重塑竞争起点。
未来的算力社会:三条可能的路
站在2026年往回看,算力荒大概只是一个开始。未来五到十年,算力供需的天平不太可能突然摆回平衡点。需求侧,龙虾之后还会有更复杂的智能体,视频生成之后还会有实时交互的虚拟世界。供给侧,晶圆厂的建设周期、电网的改造速度、土地和能源的硬约束,每一样都急不来。
[物价飞涨的时候 这样省钱购物很爽]
还没人说话啊,我想来说几句
听起来像科幻电影里的桥段。但龙虾类产品已经真实地涌入了市场。阿里一口气推出了两款,面向个人的JVSClaw和面向企业的悟空。字节、腾讯、月之暗面的类似产品也在密集上线。Anthropic的Claude Code更是点燃了程序员群体的热情,用AI写代码从一个辅助功能变成了全自动流水线。
龙虾的走红,彻底改写了算力消耗的方程式。
以前你用AI聊天,问一句答一句,单次对话消耗几百到几千Token,完事。龙虾不一样。你给它一个任务,它可能连续工作十分钟、半小时甚至更久。每一步推理、每一次工具调用、每一轮自我纠错,都在烧Token。一个简单的“帮我整理这周的工作报告”,龙虾可能需要打开邮箱、下载附件、阅读文档、提取要点、生成大纲、撰写正文、检查错别字、发送预览——整套流程下来,Token消耗是普通对话的几十倍。
更关键的是,龙虾让AI从一个“你主动找它”的工具,变成了“它替你守在那里”的同事。你可以睡前丢给它一个任务,它通宵干活,第二天早上交结果。这种使用场景意味着AI的运行时间从“偶尔”变成了“持续”。一个人如果认真用龙虾,一天的Token消耗轻松抵得上过去一个月。
需求曲线被狠狠向上掰了一截。
云服务商的反应很诚实。CoreWeave涨价超过20%。阿里云的GPU实例价格也在上浮。国内外多家云厂商开始对智能体类应用单独设置调用上限,或者在高峰时段限流。Anthropic宣布工作日上午5点到11点限制Token消耗量,用户一片哀嚎。有人在社交平台上写:“我这周45分钟就打穿了额度,以前几周都用不完。”
物理规律已经在收税。
普通人的算力账单:隐形分层已经开始
龙虾热把一个问题推到了台前:当算力变成稀缺资源,普通人怎么办?
表面上看,AI服务还在免费或低价。千问App、豆包、元宝、Claude免费版,都还能用。但“能用”和“够用”之间的距离正在拉大。
第一个变化是限流。你正在用龙虾处理一份重要文件,弹窗跳出来:“您已达到当前时段的使用上限,请稍后再试。”稍后是多久?可能是一个小时,可能是四个小时。你的工作节奏被打断了。这种打断不是技术故障,是算力配给的必然结果。云厂商把有限的资源优先分配给签了长约、付了高价的企业客户,个人用户免费或低价套餐的优先级自然靠后。
第二个变化是服务质量缩水。同样的提问,高峰期得到的回复可能更短、更浅、更敷衍。背后的原因很简单:模型在处理高并发请求时会自动“降级”,用更小的参数版本、更少的推理步数来节省算力。用户感知不到技术细节,但能感觉到“AI好像变笨了”。
第三个变化是付费门槛的实质性抬高。过去你觉得每月二十美元订阅费是“为效率买单”。以后这个价格买到的可能只是基础版,真正好用的龙虾功能需要加钱解锁。算力成本最终会沿着产业链向下传导,落在每个用户的账单上。
一种新的数字鸿沟正在成形。
它不像过去的“有没有网”“有没有智能机”那么显眼。它更隐蔽,但影响更深。一边是企业客户、高付费用户享受着接近无限的算力供给,龙虾可以通宵跑,任务可以并行开。另一边是普通用户面对着越来越频繁的“请稍后再试”,在算力配给的夹缝中精打细算。
有人会说,市场经济嘛,稀缺资源价高者得,天经地义。这个逻辑没错。但问题在于,AI正在从一个可有可无的新奇玩具,变成许多人的生产力工具、学习工具、创作工具。当一个工具开始影响人们的工作能力和收入潜力时,使用权的差异就不再只是消费选择的问题了。
想一想。未来某个岗位的招聘要求写着“熟练使用龙虾类工具”。应聘者A的公司配了企业版,算力管够,作品集精雕细琢。应聘者B自己掏钱用免费版,每天被限流三次,产出效率天然低一截。这种差距是因为算力配额。它会在不知不觉中重塑竞争起点。
未来的算力社会:三条可能的路
站在2026年往回看,算力荒大概只是一个开始。未来五到十年,算力供需的天平不太可能突然摆回平衡点。需求侧,龙虾之后还会有更复杂的智能体,视频生成之后还会有实时交互的虚拟世界。供给侧,晶圆厂的建设周期、电网的改造速度、土地和能源的硬约束,每一样都急不来。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:



