别盯着GPU了,CPU正成为AI时代的"新瓶颈"
在AI狂飙的这些年里,行业几乎被一条逻辑主导:算力决定上限,而GPU就是算力的核心。
不过,进入2026年,这套逻辑开始变动:模型推理不再是唯一瓶颈,系统性能越来越取决于执行与调度能力。GPU依然重要,但决定AI“能不能跑起来”的关键,正逐渐转向长期被忽视的CPU。
美国当地时间4月9日,谷歌与英特尔达成多年协议,在全球AI数据中心规模部署英特尔的“Xeon至强处理器”,正是为了破解这个瓶颈。英特尔CEO陈立武直言,AI运行在整个系统上,CPU和IPU才是性能、效率和灵活性的关键。换句话说,过去两年被当作“配角”的CPU,正在卡住AI扩展的脖子。
CPU不再只是一个被动的配套组件,而正在成为AI基础设施中的关键变量之一。
01 一场“悄无声息”的供应危机
当大家都在盯着GPU的交货周期时,CPU市场的紧张气氛已经悄然拉满。
根据多家IT分销商的最新报告,2025年第四季度,服务器CPU的平均售价上涨了约30%。这种涨幅在相对成熟的CPU市场是非常罕见的。
AMD数据中心负责人福雷斯特·诺罗德(Forrest Norrod)透露,过去三个季度,CPU需求的增长速度超乎想象。目前,AMD的交付周期已经从原来的八周延长到了十周以上,部分型号甚至面临长达六个月的延迟。
这种短缺主要由于“次级效应”引发的挤兑。有业内人士表示,由于台积电的3nm生产线极其紧张,原本分配给CPU的晶圆产能,正不断被利润更高的GPU订单资源挤占。这导致了一个极具讽刺意味的局面:AI实验室拥有了足够的GPU,却发现市场上买不到足够的顶级CPU来“带”动这些显卡。
在这一轮CPU抢购潮中,还有埃隆·马斯克(Elon Musk)。
英特尔首席执行官陈立武在社交平台上证实,马斯克已委托英特尔为其在得克萨斯州的“Terafab”项目设计并制造定制芯片。这个庞大的项目旨在为xAI、SpaceX和特斯拉提供统一的计算底座。
马斯克对英特尔的信任,在很大程度上是因为英特尔正试图将自己嵌入到从地面数据中心到太空轨道计算的每一个层面。

对于英特尔来说,这无疑是一剂强心针。有行业分析师预测AMD在服务器CPU市场的收入份额将在2026年超过英特尔,但英特尔在x86生态系统中的深厚惯性和制造能力,依然是马斯克这类大客户无法忽视的筹码。
这种跨行业的深度捆绑,正让CPU市场的竞争从单纯的参数比拼,升级为生态系统和供应链稳定性的博弈。
02 为什么CPU会成为“短板”?
CPU突然成为瓶颈,核心是它需要承担的工作,在智能体时代发生了根本性变化。
在传统聊天机器人模式中,CPU主要负责调度和数据处理,GPU承担核心推理计算。由于计算密集型环节集中在GPU侧,整体延迟通常由GPU主导,CPU很少成为性能瓶颈。
但智能体工作负载完全不同。 一个智能体需要执行多步推理、调用API、读写数据库、编排复杂业务流,并将中间结果整合为最终输出。搜索、API调用、代码执行、文件I/O和结果编排等任务,大部分落在CPU和主机系统侧。GPU负责token生成(即 “思考”),而CPU负责将“思考”结果转化为实际行动。
乔治亚理工学院学者在2025年11月发表的论文《以CPU为中心的智能体型AI视角》(A CPU-Centric Perspective on Agentic AI)中,对智能体工作负载中的延迟分布进行了量化分析。研究发现,CPU端工具处理所占用的时间,占总延迟的50%至90.6%。在某些场景下,GPU已准备好处理下一批任务,而CPU仍在等待工具调用返回。
[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
不过,进入2026年,这套逻辑开始变动:模型推理不再是唯一瓶颈,系统性能越来越取决于执行与调度能力。GPU依然重要,但决定AI“能不能跑起来”的关键,正逐渐转向长期被忽视的CPU。
美国当地时间4月9日,谷歌与英特尔达成多年协议,在全球AI数据中心规模部署英特尔的“Xeon至强处理器”,正是为了破解这个瓶颈。英特尔CEO陈立武直言,AI运行在整个系统上,CPU和IPU才是性能、效率和灵活性的关键。换句话说,过去两年被当作“配角”的CPU,正在卡住AI扩展的脖子。
CPU不再只是一个被动的配套组件,而正在成为AI基础设施中的关键变量之一。
01 一场“悄无声息”的供应危机
当大家都在盯着GPU的交货周期时,CPU市场的紧张气氛已经悄然拉满。
根据多家IT分销商的最新报告,2025年第四季度,服务器CPU的平均售价上涨了约30%。这种涨幅在相对成熟的CPU市场是非常罕见的。
AMD数据中心负责人福雷斯特·诺罗德(Forrest Norrod)透露,过去三个季度,CPU需求的增长速度超乎想象。目前,AMD的交付周期已经从原来的八周延长到了十周以上,部分型号甚至面临长达六个月的延迟。
这种短缺主要由于“次级效应”引发的挤兑。有业内人士表示,由于台积电的3nm生产线极其紧张,原本分配给CPU的晶圆产能,正不断被利润更高的GPU订单资源挤占。这导致了一个极具讽刺意味的局面:AI实验室拥有了足够的GPU,却发现市场上买不到足够的顶级CPU来“带”动这些显卡。
在这一轮CPU抢购潮中,还有埃隆·马斯克(Elon Musk)。
英特尔首席执行官陈立武在社交平台上证实,马斯克已委托英特尔为其在得克萨斯州的“Terafab”项目设计并制造定制芯片。这个庞大的项目旨在为xAI、SpaceX和特斯拉提供统一的计算底座。
马斯克对英特尔的信任,在很大程度上是因为英特尔正试图将自己嵌入到从地面数据中心到太空轨道计算的每一个层面。
对于英特尔来说,这无疑是一剂强心针。有行业分析师预测AMD在服务器CPU市场的收入份额将在2026年超过英特尔,但英特尔在x86生态系统中的深厚惯性和制造能力,依然是马斯克这类大客户无法忽视的筹码。
这种跨行业的深度捆绑,正让CPU市场的竞争从单纯的参数比拼,升级为生态系统和供应链稳定性的博弈。
02 为什么CPU会成为“短板”?
CPU突然成为瓶颈,核心是它需要承担的工作,在智能体时代发生了根本性变化。
在传统聊天机器人模式中,CPU主要负责调度和数据处理,GPU承担核心推理计算。由于计算密集型环节集中在GPU侧,整体延迟通常由GPU主导,CPU很少成为性能瓶颈。
但智能体工作负载完全不同。 一个智能体需要执行多步推理、调用API、读写数据库、编排复杂业务流,并将中间结果整合为最终输出。搜索、API调用、代码执行、文件I/O和结果编排等任务,大部分落在CPU和主机系统侧。GPU负责token生成(即 “思考”),而CPU负责将“思考”结果转化为实际行动。
乔治亚理工学院学者在2025年11月发表的论文《以CPU为中心的智能体型AI视角》(A CPU-Centric Perspective on Agentic AI)中,对智能体工作负载中的延迟分布进行了量化分析。研究发现,CPU端工具处理所占用的时间,占总延迟的50%至90.6%。在某些场景下,GPU已准备好处理下一批任务,而CPU仍在等待工具调用返回。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
别盯着GPU了,CPU正成为AI时代的"新瓶颈"