[特斯拉] 小鹏和特斯拉,谁是"物理AI"的未来?
小鹏的第二代VLA,就是要拿掉“翻译”环节,采用“视觉—隐式Token—动作”的架构。这里的“隐式Token”可以理解为一种AI内部的、非语言的“心领神会”,让AI从“看到”直接跳到“行动”。这就像是给AI训练出了“肌肉记忆”或“直觉”。它不再需要“思考”皮球的危险性,而是能凭借从海量数据学习到的物理规律,本能地做出反应。
在实际驾驶中,这种“AI直觉”会给用户带来什么改变?总结来说就是,反应更快,驾驶更拟人,不依赖地图时,也能更稳定、自主地驾驶。
例如,在没有高精地图覆盖的次级道路上,小鹏数据显示,其“小路NGP”(在非主干道上的智能驾驶)功能的平均接管里程优化了13倍。同时,小鹏发布的“无导航超级漫游”(Super-LCC)功能,也让车辆在无预设导航路径时,凭借对环境的实时理解进行驾驶辅助。
本质上,小鹏选择的技术路径是,教会AI“凭本能反应”。这是智能体进入物理世界的第一步,也是最关键的一步。
有了能快速反应的“大脑”,物理AI最终要落在能执行动作的“身体”上。小鹏没有为每个硬件都开发一个专门的AI,而是把“大脑”用在三种不同的“身体”上:汽车、人形机器人和飞行汽车。这并非简单的“一芯多用”,而是在培养全能型的“通才”。

我们可以这样理解:AI在驾驶汽车时学到的经验,比如如何识别红绿灯、如何预判行人意图,可以被无缝迁移到人形机器人身上,帮助它在复杂的商场里规划路径、避开行人。
在这个“跨域同源”的设计下,知识可以共享,经验可以复用,学习效率远高于训练三个独立的“专才”。关键是,这套“一脑多用”的架构,更能解决物理AI落地的关键难题:如何让AI的能力突破单一场景,在复杂的现实世界中灵活应变、举一反三。
接下来的问题是,“大脑”和多功能的“身体”如何高效协同工作?这就触及了最底层的体系,就像我们身体的“神经系统”。小鹏选择全栈自研,通俗地理解,就是打造一套稳定、自主可控的“神经系统”。
我们可以用苹果的例子来理解“全栈自研”的分量。苹果之所以能构建起强大的生态壁垒,核心就在于它自己设计芯片(A系列/M系列),自己开发操作系统(iOS/macOS),自己设计硬件(iPhone/Mac)。这种模式确保了指令从大脑到身体的传递过程中,损耗最小,响应最快。它以此实现了深度的优化与整合。
小鹏的路径颇为相似:从最底层的“图灵AI芯片”,到中间的“操作系统”层“VLA/VLM/VLT大模型体系”,再到上层的汽车、机器人、飞行汽车等硬件,所有核心环节都掌握在自己手中。这确保了其物理AI架构形成一个独立性、完整且不受制于人的闭环。
至此,小鹏的技术版图已经清晰:“直觉式”AI模型+“跨域同源”的多种硬件+“全栈自研”的技术架构。
更落地的“中国方案”
看清了小鹏的技术底牌,一个更现实的问题随之而来:这套架构在行业中究竟属于什么位置?小鹏又打算如何将其推向市场?
答案其实就藏在它的定位上。小鹏强调,它是“中国唯一实现物理AI全栈自研”的企业。
要理解这一点,最好的对标对象是华为。华为的盘古大模型体系中包含了世界模型技术,但其商业模式是向行业提供智能驾驶解决方案与算力服务,本质是向外输出通用能力,目前并不亲自下场制造硬件载体。它的角色,更像是物理AI时代的“英特尔”或“高通”。
而小鹏确实是目前唯一一个展示“多类具身智能载体+统一AI大脑+关键硬件自研”布局的公司。这样做最大的好处就是,能实现深度的“软硬一体”,带来的直接结果是,用户体验更流畅,技术迭代也更迅速。
[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
在实际驾驶中,这种“AI直觉”会给用户带来什么改变?总结来说就是,反应更快,驾驶更拟人,不依赖地图时,也能更稳定、自主地驾驶。
例如,在没有高精地图覆盖的次级道路上,小鹏数据显示,其“小路NGP”(在非主干道上的智能驾驶)功能的平均接管里程优化了13倍。同时,小鹏发布的“无导航超级漫游”(Super-LCC)功能,也让车辆在无预设导航路径时,凭借对环境的实时理解进行驾驶辅助。
本质上,小鹏选择的技术路径是,教会AI“凭本能反应”。这是智能体进入物理世界的第一步,也是最关键的一步。
有了能快速反应的“大脑”,物理AI最终要落在能执行动作的“身体”上。小鹏没有为每个硬件都开发一个专门的AI,而是把“大脑”用在三种不同的“身体”上:汽车、人形机器人和飞行汽车。这并非简单的“一芯多用”,而是在培养全能型的“通才”。

我们可以这样理解:AI在驾驶汽车时学到的经验,比如如何识别红绿灯、如何预判行人意图,可以被无缝迁移到人形机器人身上,帮助它在复杂的商场里规划路径、避开行人。
在这个“跨域同源”的设计下,知识可以共享,经验可以复用,学习效率远高于训练三个独立的“专才”。关键是,这套“一脑多用”的架构,更能解决物理AI落地的关键难题:如何让AI的能力突破单一场景,在复杂的现实世界中灵活应变、举一反三。
接下来的问题是,“大脑”和多功能的“身体”如何高效协同工作?这就触及了最底层的体系,就像我们身体的“神经系统”。小鹏选择全栈自研,通俗地理解,就是打造一套稳定、自主可控的“神经系统”。
我们可以用苹果的例子来理解“全栈自研”的分量。苹果之所以能构建起强大的生态壁垒,核心就在于它自己设计芯片(A系列/M系列),自己开发操作系统(iOS/macOS),自己设计硬件(iPhone/Mac)。这种模式确保了指令从大脑到身体的传递过程中,损耗最小,响应最快。它以此实现了深度的优化与整合。
小鹏的路径颇为相似:从最底层的“图灵AI芯片”,到中间的“操作系统”层“VLA/VLM/VLT大模型体系”,再到上层的汽车、机器人、飞行汽车等硬件,所有核心环节都掌握在自己手中。这确保了其物理AI架构形成一个独立性、完整且不受制于人的闭环。
至此,小鹏的技术版图已经清晰:“直觉式”AI模型+“跨域同源”的多种硬件+“全栈自研”的技术架构。
更落地的“中国方案”
看清了小鹏的技术底牌,一个更现实的问题随之而来:这套架构在行业中究竟属于什么位置?小鹏又打算如何将其推向市场?
答案其实就藏在它的定位上。小鹏强调,它是“中国唯一实现物理AI全栈自研”的企业。
要理解这一点,最好的对标对象是华为。华为的盘古大模型体系中包含了世界模型技术,但其商业模式是向行业提供智能驾驶解决方案与算力服务,本质是向外输出通用能力,目前并不亲自下场制造硬件载体。它的角色,更像是物理AI时代的“英特尔”或“高通”。
而小鹏确实是目前唯一一个展示“多类具身智能载体+统一AI大脑+关键硬件自研”布局的公司。这样做最大的好处就是,能实现深度的“软硬一体”,带来的直接结果是,用户体验更流畅,技术迭代也更迅速。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: