不是什么都叫"世界模型",李飞飞给出新定义




斯坦福大学AI科学家、World Labs创始人李飞飞。图片经由AI处理

文丨谢瑞瑞

编辑丨徐青阳

“世界模型”是过去两年AI领域最常被提及的概念之一,但它的含义正在变得越来越模糊。

视频生成模型、语言模型,甚至连物理引擎都能自称是世界模型。

斯坦福大学AI科学家、World Labs创始人李飞飞于6月4日撰文,专门回应这种混乱。她开篇便给出判断:世界模型是当今AI领域最重要、也最被滥用的术语之一。

她在文中写道,连古希腊人都没给“世界”下过一个统一、公认的定义。“世界”从来不是一个具体的事物,今天,AI也继承了同样的问题——世界模型的边界在哪里?

李飞飞的解决思路很明确:先分清世界模型的三个核心功能——渲染、模拟、规划。

01 理解世界模型的钥匙,是一张旧图

在展开论述之前,李飞飞先回顾了一张在强化学习领域使用了几十年的框架图:部分可观测马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)。这个框架的名称很复杂,但逻辑却简明。



李飞飞将目前的世界模型系统分为三类,分别是渲染器、模拟器以及规划器

它描述的是一个循环:智能体采取行动,行动改变世界的状态,智能体从环境中获得观测值,再依据观测采取下一步行动。循环持续进行。


文中的“状态”,指的是物理学和机器人学中的概念:在某个时刻对世界状况的完整描述,涵盖每一个物体、每一个位置、每一组速度和每一项属性,对身处其中的任何智能体而言,永远无法被完全直接感知。我们能得到的,只是对现实的部分观测。

李飞飞进一步指出,这个由“智能体—行动—状态—观测—回到智能体”构成的闭环,赋予了现代世界模型真正的技术内核。

“世界模型”概念,最早可以追溯到1943年,由心理学家肯尼斯·克雷克(Kenneth Craik)在1943年提出,即大脑通过运行现实的“小规模模型”来进行推理。到了20世纪80年代末、90年代初,这个概念被引入神经网络研究。而今天,所有被称为世界模型的事物,本质上都是同一个循环在不同方向上的投影,每一类只输出循环中的一个片段。

02 三类世界模型:渲染器、模拟器与规划器

李飞飞认为,当前所有自称世界模型的系统可分为三类:渲染器、模拟器和规划器。

第一类世界模型是渲染器。它的输出是供人眼观看的像素,核心评估指标是视觉逼真度。



[加西网正招聘多名全职sales 待遇优]
还没人说话啊,我想来说几句
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    喜剧让他破圈出名,但这不能定义他 60岁拿下世界大奖 她战胜了疾病 更战胜了自己
    河南中专生成北大博士:这不是逆袭 只是回到正常 美股一夜蒸发万亿 "区区"17万非农凭什么
    肺癌早期不是咳嗽,而是频繁出现这3症状 黄仁勋下一步不是芯片?"这些飙股"泄新野心
    维C不是仙丹!过量可能出现4大中毒症状 SpaceX真正的"定海神针"不是马斯克
    深夜看这剧哭了一整集,不是剧情太虐,是看见自己 这10部西部剧,凭什么一季都没烂尾?
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站