[马云] 吴泳铭23分钟演讲,让阿里巴巴股价涨了2200亿

提问:咱们在各个领域的模型快速迭代,在我们研发人员精力有限的情况下,这样的策略会影响我们做一些更底层的算法或者范式上的创新?快速的跟随迭代,这些底层的范式创新,还有应用场景的落地,我们会把优先级怎么排?
周靖人:首先我认为在模型整个创新这方面,不是分散的。今天我们讲到所有模型的发布,背后都是连在一起的。都是突破今天模型不管是单个模态、单个任务集,以及今天在多模态方面的能力。有的时候你需要在单模态有一个具体任务的场景里面能够做到最优,然后才能提高一个整体模型的能力。这方面所有的模型的发展,一定不是一个单一的项目。它是整体通义整个大模型演进联合优化的一部分。
所以在这方面,其实是融合在一起的。我们所有项目的规划,项目的优先级,都是有相关重要的一个联系。
另外,我们不单单是积极模型的创新和迭代,大家也可以看得到,从今年年初到现在已经突飞猛进,甚至已经有几代模型的发展。每一代模型的能力有大幅度的提升,同时我们也在积极做下一代模型的研发。包括今天讲到的通义千问的Next版,今天就在架构上面做了大量的创新。我们一旦推出来过后,整个社区都在围绕新的架构进行适配、进行相关的尝试。我们可以看到,像通义千问Next模型的推出,也在积极的推动整个模型社区的创新迭代。所以,在这方面这几个是相辅相成的。
模型的发展是一个循序渐进的,不是憋大招的逻辑。所有的海外厂商都会逐步的发展起来,今天在中间是需要加快模型迭代以及创新的速度。
提问:今年有一个新的技术趋势,就是Agent mode,有厂商他会把Agent能力做在mode里面,但是我们看到Qwen的模型还是在为Agent提供一个核心的引擎,他们还是相互独立的。您认为未来mode跟Agent的能力它们是一个怎样的关系,阿里的选择是什么?
周靖人:其实这没有一个明确的边界解。我们的模型服务本身也会具备Agent的能力,包括一些核心的工具的使用。简单来讲,从模型发展的第一天,具备搜索的功能,它本身就是一个Agent。所以,今天我们讲到很多的模型服务,大模型本身也是一个Agent。所以,没有一个完全非黑即白的逻辑。
我们今天讲到的智能体的开发,是面向行业的智能体开发。这部分因为它需要对当前每个行业的Know-how,行业的一些知识体系要能够有一个深度的认知。这部分还是需要有一些面向行业的智能体的开发,而这一部分会集成,今天讲到的百炼会提供一些核心的Agent的能力,这些Agent能力在通义千问、在万相里面也会慢慢的集成进去,也就是说底层的模型会越来越强大,也会集成相关的工具。但今天面向业务层工具的使用,业务层的调优,还是需要有业务层的智能体来做实现和解决。
提问:想请教一下靖人,像您说的现在大的技术路线没有大的分歧,但具体要看怎么做。像GPT-5发布之后,大家普遍会对模型创新上一些进展会有些沮丧,可能觉得现在模型演进路线有些碰壁。但阿里也提出一个蛮激进的路线,迈向ASI。如果说现在阿里想要在模型上保持领先,您觉得最关键的要素是什么?是底层的算法创新,是数据还是什么其他的?
周靖人:我觉得这两个不在一个维度,我们不评价OpenAI这次发布,可能大家对它的发布期待比较大,并不代表整个行业。我们看到整个行业各家模型能力整个提升的速度仍然没有任何减缓,不管是在工具使用、复杂的深度推理等等,各家模型都有长足的进步。
大家可以看到,我们在通义千问也有很强的进展。我不认为创新的速度有任何减缓,全球在这方面投资也在加速,都在印证AI模型的上界,还没有看到,我们还在不断加速,不断创新过程中。至于要达到吴泳铭先生今天讲到的ASI,其实这中间有非常多难题需要解决。当然从目前看,模型整个复杂,包括处理能力,包括深度思考的能力,我们解决的有些好的地方,像数学、代码,还有其他的场景。真正做到各种工具快速的接入,模型训练的方式、模型创新的模式、模型的结构,都有可能发生很多一系列变化。最终还要做到模型自主完成学习,自主通过反馈,利用跟世界的交互,能够收集反馈,能够用好反馈去做模型进一步进化和升级。这中间从我们当前一代代模型发展的路线,要慢慢营造成模型持续去学习、持续去自我完善的过程。这中间有架构上的挑战,有系统方面的挑战,有算法上面的挑战。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐:



