中国AI与美国的差距还在扩大,北大教授悲观
前字节跳动工程师、北大教授张池指出,中美人工智能差距并未缩小,反而在扩大。国内大模型沉迷于“刷榜”拿高分,实际应用拉胯;训练数据质量低、迭代周期是美国2-4倍、用户付费意愿弱形成负循环。那些美国名人“中国正在赶超”的论调,可能只是美国企业家的“烟雾弹”。
尽管外界普遍说我们在人工智能领域正在赶上美国,在有些领域可能已经领先。但一位前字节跳动工程师认为,实际上差距正在进一步扩大。
周末,北京大学助理教授、研究科学家兼助理教授张池(音译)在《进入亚洲》播客节目中说:“我甚至不同意中国模型正在追赶的假设——我认为我们仍然远远落后。非常遗憾,我认为差距正在扩大”。
张池表示,他在字节跳动的人工智能部门工作了大约一年,专注于人工智能模型,之后重返学术界。他表示,不否认人工智能的中国初创企业在快速发展,但由于美国的发展可能更快,我们必须认识到在我们快速发展的同时,实际上差异不仅没有缩小,反而在持续扩大。这应该是正确认识我们的人工智能行业的重要的一部分。
一、中国大模型专注于如何提高基准测试的得分,但在实际应用中表现拉跨。
张池认为,虽然像字节跳动和阿里巴巴这样的大公司开放的大模型在基准测试中得分不错,但这并不意味着它们在现实世界的应用中表现同样出色。理论上,我们的每家大型科技公司都有好的大模型。但实际上它们还不够好。因为许多大模型团队专注于“benchmaxxing”——更注重考试成绩而非实际表现的模型。如同于我们的一些名头响亮的高中,专注于培训学生如何提高高考得分,成为考试机器,但很少注意如何提高学生的创造力。
字节跳动和阿里巴巴推出了高知名度的AI模型——从像Seedance这样的视频生成器到像Qwen这样的开源系统——但他们也因深度伪造、版权纠纷以及这些模型在现实中是否经得起考验而遭遇了用户端的广泛质疑。
二、中美大模型在基础设施和训练数据方面存在难以弥补的差距。
美国的大模型和中国大模型的基础设施方面存在的巨大差距,是最公开的差距。这种差别不仅仅表现在我们无法获取先进芯片,数据中心基础设施薄弱,这些硬件的差距摆在桌面上,大家容易看到。更大地、大家看不到的差距是大模型训练数据质量较低。我们的大模型无法获得高质量的数据,训练数据甚至被人为污染,这是中国大模型普遍存在结构性劣势。

作者声明:该图片由AI生成
而且,训练大模型的数据质量较低这一劣势难以逆转。因为造成这一劣势的两大原因是制度性的而非技术性的。比如我们对互联网普遍存在的敏感单词的审查导致的语言污染,比如我们的大模型应用产品和软件一样难以获得付费用户,导致人工智能获利模式转向异端——如同互联网时代的搜索引擎一样利用关键词获利,导致训练数据甚至被人为污染。
逻辑上,在被污染的大模型数据面前,大模型的理论评分,有何意义?
很多人不理解我们的大多数大模型公司,为何热衷于并依赖于从领先的美国模型中提取数据,而非建立自己的数据管道。公开的评论大都认为这是一条捷径,可以节省大模型投资。但大家忽略了其背后两大问题:一是依赖对美国大模型的蒸馏,一些人工智能公司可能是迫不得已,因为他们非常清楚我们提供给大模型训练的数据质量堪忧。二是美国三大大模型巨头和白宫,都在出手遏制对其大模型的蒸馏,这必然将限制我们大模型的长期发展。
三、我们的大模型更新迭代的周期是美国的2-4倍。

[物价飞涨的时候 这样省钱购物很爽]
无评论不新闻,发表一下您的意见吧
尽管外界普遍说我们在人工智能领域正在赶上美国,在有些领域可能已经领先。但一位前字节跳动工程师认为,实际上差距正在进一步扩大。
周末,北京大学助理教授、研究科学家兼助理教授张池(音译)在《进入亚洲》播客节目中说:“我甚至不同意中国模型正在追赶的假设——我认为我们仍然远远落后。非常遗憾,我认为差距正在扩大”。
张池表示,他在字节跳动的人工智能部门工作了大约一年,专注于人工智能模型,之后重返学术界。他表示,不否认人工智能的中国初创企业在快速发展,但由于美国的发展可能更快,我们必须认识到在我们快速发展的同时,实际上差异不仅没有缩小,反而在持续扩大。这应该是正确认识我们的人工智能行业的重要的一部分。
一、中国大模型专注于如何提高基准测试的得分,但在实际应用中表现拉跨。
张池认为,虽然像字节跳动和阿里巴巴这样的大公司开放的大模型在基准测试中得分不错,但这并不意味着它们在现实世界的应用中表现同样出色。理论上,我们的每家大型科技公司都有好的大模型。但实际上它们还不够好。因为许多大模型团队专注于“benchmaxxing”——更注重考试成绩而非实际表现的模型。如同于我们的一些名头响亮的高中,专注于培训学生如何提高高考得分,成为考试机器,但很少注意如何提高学生的创造力。
字节跳动和阿里巴巴推出了高知名度的AI模型——从像Seedance这样的视频生成器到像Qwen这样的开源系统——但他们也因深度伪造、版权纠纷以及这些模型在现实中是否经得起考验而遭遇了用户端的广泛质疑。
二、中美大模型在基础设施和训练数据方面存在难以弥补的差距。
美国的大模型和中国大模型的基础设施方面存在的巨大差距,是最公开的差距。这种差别不仅仅表现在我们无法获取先进芯片,数据中心基础设施薄弱,这些硬件的差距摆在桌面上,大家容易看到。更大地、大家看不到的差距是大模型训练数据质量较低。我们的大模型无法获得高质量的数据,训练数据甚至被人为污染,这是中国大模型普遍存在结构性劣势。

作者声明:该图片由AI生成
而且,训练大模型的数据质量较低这一劣势难以逆转。因为造成这一劣势的两大原因是制度性的而非技术性的。比如我们对互联网普遍存在的敏感单词的审查导致的语言污染,比如我们的大模型应用产品和软件一样难以获得付费用户,导致人工智能获利模式转向异端——如同互联网时代的搜索引擎一样利用关键词获利,导致训练数据甚至被人为污染。
逻辑上,在被污染的大模型数据面前,大模型的理论评分,有何意义?
很多人不理解我们的大多数大模型公司,为何热衷于并依赖于从领先的美国模型中提取数据,而非建立自己的数据管道。公开的评论大都认为这是一条捷径,可以节省大模型投资。但大家忽略了其背后两大问题:一是依赖对美国大模型的蒸馏,一些人工智能公司可能是迫不得已,因为他们非常清楚我们提供给大模型训练的数据质量堪忧。二是美国三大大模型巨头和白宫,都在出手遏制对其大模型的蒸馏,这必然将限制我们大模型的长期发展。
三、我们的大模型更新迭代的周期是美国的2-4倍。

[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
中国AI与美国的差距还在扩大,北大教授悲观