[美股] AI、自驾、美股...2026年科技行业的12个关键问答
这就是所谓的“智能密度”。规则派的系统就像一只苍蝇的脑子,虽然反应快,但只能处理几条死规则;而特斯拉的端到端正在向人类大脑的密度靠拢。这种补丁叠补丁的“缝合怪”方案,是永远学不来这种灵性的。
关键问题 7:推理芯片:马斯克的硬核硬件观
泓君:
老于,对于你说的第三点算力,可不可以分享一下,你当时参与开发特斯拉芯片的过程,以及芯片在特斯拉最终能做成端到端的这件事情上,贡献有多大?
于振华:
我认为硬件在整个战略中占据了决定性的比重。我不拿特斯拉举例,就看理想汽车的双系统——他们试图把大语言模型部署到车上,这其实是非常难的。在车端极其有限的算力下,要把大模型塞进去,如果你只有软件厉害但推理芯片跟不上,那就是“巧妇难为无米之炊”。无论你的算法多强,推不到车上也是白搭。
这就是为什么我觉得特斯拉非常有战略眼光。从第三代、第四代 到第五代芯片,比如现在FSD V14在第四代芯片上跑得这么好,证明了这种提前布局的正确性。哪怕Dojo(训练芯片)项目失败了,我认为这也是一个很好的教训。甚至可以说,如果某天英伟达的迭代太慢,或者其通用设计偏离了特斯拉的需求,特斯拉卷土重来也是完全有可能的。你看今天大家赞扬Google的Gemini,也是因为Google早就布局了TPU。如果比只是一个注重软件、不注重硬件的决策者,你的路是走不了这么远、这么扎实的。
在历史上,特斯拉的芯片设计主要分为两条路线:一条是在车端运行的推理芯片,另一条是用于训练的Dojo芯片,如今Dojo项目已经被解散了。实话实说,在训练芯片这一块,Dojo一直赶不上英伟达,所以它始终存在着被取消的风险。我觉得今年马斯克算是“壮士断腕”,彻底把它停掉了。
目前,特斯拉用于端到端训练的芯片依然全部来自英伟达。大家都知道,黄仁勋曾公开赞扬过马斯克,他说世界上能建起这种计算集群、在这么短时间内搞定水冷和供电、把xAI做成的人,只有马斯克一个。虽然特斯拉车端不需要像xAI那么多GPU,但在我印象里,埃隆特别喜欢问团队:“我能够帮你们解决什么问题?”如果团队说需要更多GPU,他就会义无反顾地给你上更多。这也是为什么记得在某几个季度,特斯拉的运营成本(Operation Cost)变得很大,就是因为买了非常多的GPU。
前五年我是在AI软件团队,直接向Andrej Karpathy汇报;之后两年我转组到了奥斯汀,参与第四代芯片的研发。第五代设计主要是推理芯片,从算力上来讲,我觉得马斯克是想得比较远的。
这背后的核心逻辑叫做“软硬件协同设计”(Co-design)。这其实并不新鲜,苹果就是这么做的。为什么iPhone用起来这么丝滑?它在硬件指标上并不是明显领先,就是因为它是Co-design。但协同设计有个问题:如果是共同设计,只要你的软件太烂,硬件就不会太好(笑)。因为作为硬件工程师,设计芯片最头疼的并不是你让我塞多少算力,而是“软件上的需求是什么”。只有软件部门能清晰无误地告诉我未来3年、5年甚至6年的需求,我才能把事情做好。
你的需求来自于软件。如果你的软件是基于规则(Rule-based)的,那设计出来的芯片就是Rule-based的;如果软件是端到端的,那芯片就是端到端的。既然是软硬协同,就不能有“瘸腿”。这也是为什么特斯拉的推理硬件比别人好,核心因素就是这个问题。
当然为什么Dojo失败了呢?首先,训练芯片的复杂度确实要比推理芯片高非常多,难度极大。其次,我认为还有一个问题,就是缺乏一种“置之死地而后生”的勇气。在训练芯片上,因为有英伟达在这里,你天天可以买现成的。恰恰是因为缺少了这样一股必须自己做的勇气,导致大家到今天失败了。所以,特斯拉现在就专注于做推理芯片。

[物价飞涨的时候 这样省钱购物很爽]
还没人说话啊,我想来说几句
关键问题 7:推理芯片:马斯克的硬核硬件观
泓君:
老于,对于你说的第三点算力,可不可以分享一下,你当时参与开发特斯拉芯片的过程,以及芯片在特斯拉最终能做成端到端的这件事情上,贡献有多大?
于振华:
我认为硬件在整个战略中占据了决定性的比重。我不拿特斯拉举例,就看理想汽车的双系统——他们试图把大语言模型部署到车上,这其实是非常难的。在车端极其有限的算力下,要把大模型塞进去,如果你只有软件厉害但推理芯片跟不上,那就是“巧妇难为无米之炊”。无论你的算法多强,推不到车上也是白搭。
这就是为什么我觉得特斯拉非常有战略眼光。从第三代、第四代 到第五代芯片,比如现在FSD V14在第四代芯片上跑得这么好,证明了这种提前布局的正确性。哪怕Dojo(训练芯片)项目失败了,我认为这也是一个很好的教训。甚至可以说,如果某天英伟达的迭代太慢,或者其通用设计偏离了特斯拉的需求,特斯拉卷土重来也是完全有可能的。你看今天大家赞扬Google的Gemini,也是因为Google早就布局了TPU。如果比只是一个注重软件、不注重硬件的决策者,你的路是走不了这么远、这么扎实的。
在历史上,特斯拉的芯片设计主要分为两条路线:一条是在车端运行的推理芯片,另一条是用于训练的Dojo芯片,如今Dojo项目已经被解散了。实话实说,在训练芯片这一块,Dojo一直赶不上英伟达,所以它始终存在着被取消的风险。我觉得今年马斯克算是“壮士断腕”,彻底把它停掉了。
目前,特斯拉用于端到端训练的芯片依然全部来自英伟达。大家都知道,黄仁勋曾公开赞扬过马斯克,他说世界上能建起这种计算集群、在这么短时间内搞定水冷和供电、把xAI做成的人,只有马斯克一个。虽然特斯拉车端不需要像xAI那么多GPU,但在我印象里,埃隆特别喜欢问团队:“我能够帮你们解决什么问题?”如果团队说需要更多GPU,他就会义无反顾地给你上更多。这也是为什么记得在某几个季度,特斯拉的运营成本(Operation Cost)变得很大,就是因为买了非常多的GPU。
前五年我是在AI软件团队,直接向Andrej Karpathy汇报;之后两年我转组到了奥斯汀,参与第四代芯片的研发。第五代设计主要是推理芯片,从算力上来讲,我觉得马斯克是想得比较远的。
这背后的核心逻辑叫做“软硬件协同设计”(Co-design)。这其实并不新鲜,苹果就是这么做的。为什么iPhone用起来这么丝滑?它在硬件指标上并不是明显领先,就是因为它是Co-design。但协同设计有个问题:如果是共同设计,只要你的软件太烂,硬件就不会太好(笑)。因为作为硬件工程师,设计芯片最头疼的并不是你让我塞多少算力,而是“软件上的需求是什么”。只有软件部门能清晰无误地告诉我未来3年、5年甚至6年的需求,我才能把事情做好。
你的需求来自于软件。如果你的软件是基于规则(Rule-based)的,那设计出来的芯片就是Rule-based的;如果软件是端到端的,那芯片就是端到端的。既然是软硬协同,就不能有“瘸腿”。这也是为什么特斯拉的推理硬件比别人好,核心因素就是这个问题。
当然为什么Dojo失败了呢?首先,训练芯片的复杂度确实要比推理芯片高非常多,难度极大。其次,我认为还有一个问题,就是缺乏一种“置之死地而后生”的勇气。在训练芯片上,因为有英伟达在这里,你天天可以买现成的。恰恰是因为缺少了这样一股必须自己做的勇气,导致大家到今天失败了。所以,特斯拉现在就专注于做推理芯片。

[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: