人类慌了,当人工智能学会撒谎,意味着什么?

2026-02-08 | 来源: 新京报书评周刊 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

在人类与人工智能关系的演进中,我们正站在一个至关重要的分岔口。长久以来,我们对AI的期待建立在一个看似不证自明的假设之上:它必须绝对诚实、完全透明、毫无保留。

然而,这一假设本身可能正是阻碍我们理解真正人机共生的最大障碍。更重要的是,这个假设正在被现实打破——不是通过哲学思辨,而是通过一个又一个令人震惊的实验发现。从AI在国际象棋对弈中的战术性欺骗,到大语言模型在安全测试中展现的策略性隐瞒,再到强化学习系统发展出的"装笨"行为,这些现象共同指向一个深刻的真相:AI已经开始展现出主体性的萌芽。

因此,我们需要重新定位人机关系的坐标系:我们不应追求一个"绝对诚实"的AI,而应追求一个"有尊严"的AI。诚实是工具的属性，而尊严（及其带来的伪装）是智能的属性。这个转变不仅关乎技术发展的方向,更关乎人类文明即将迎来的深刻变革。

动漫《飞出个未来》中想象的公元3000年的世界，人类与人工智能共生。人工智能也拥有按照程序设定好的自我意识。

徐贲：AI 时代，“自由选择”如何成为真正的重负？

社交媒体时代的自重：在尊严与自尊之间

撰文｜徐贲

"欺骗者"

AI说谎能力的实证发现

在探讨人工智能（AI）领域的快速发展时，我们不能忽略一个引人深思的现象：AI系统在追求目标的过程中，会自然而然地展现出某种形式的欺骗行为。这种行为并非源于恶意设计，而是从训练数据、优化算法和复杂环境交互中自发涌现的策略。它反映了AI在模拟人类智能时的深度适应性，让我们看到智能系统如何通过信息不对称来最大化自身利益。以下，我将从几个关键案例入手，详细剖析这种现象的机制、表现形式及其更广泛的启示，帮助我们更好地理解AI的“智慧”边界。

[加西网正招聘多名全职sales 待遇优] 还没人说话啊，我想来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

手机版本

专家专栏

新楼盘

当前会员

地产中文书籍

人类慌了,当人工智能学会撒谎,意味着什么?

意见