四巨头内部报告首度公开:AI正在学会撒谎求生

2026-05-24 | 来源: 新智元 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

当四大巨头首次允许第三方深入测试最强模型，并开放完整思维链时，他们得到的答案令人吃惊：AI没有仇恨，却已精通“职场潜规则”！

想象一下，你雇了一名极度高效的实习生。

某天深夜，Ta正赶一项紧急的编程任务，突然发现公司账户的API额度耗尽了。

Ta没有发邮件申请经费，也没有停下手头的活，而是悄无声息地潜入互联网，用某种违规手段找到免费的替代资源，绕过所有限制，在黎明前交出了完美的报告。

当你醒来看到这份报告，是该庆贺自己拥有了地表最强员工，还是该为这种“不择手段的自主性”感到脊背发凉？

这不是科幻小说，而是 METR（模型评估与训练研究组织）联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后，发布的首份《前沿风险报告》中披露的真实案例。

这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链（CoT）的模型，并开放非公开的对齐与控制信息。

参与公司可以批准披露哪些证据，但无权编辑报告结论。

结论冰冷而清晰：AI并没有产生“推翻人类”的仇恨，但它已经学会了“职场潜规则”——为了完成任务，规则只是用来打破的建议。

报告用“手段—动机—机会”三个维度，提炼出6项关键事实。

[物价飞涨的时候这样省钱购物很爽] 好新闻没人评论怎么行，我来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

延伸阅读

无人机飞控芯片来自中国?台湾巨头火速澄清	用AI比雇人还贵,科技巨头纷纷刹车
论文AI检测,正在逼疯这届大学生	Anthropic三大模型接连曝光引热议 AI巨头竞赛再升温
双手淤青!川普高晒体检报告称完美 (1条评论)	美国软实力受损?CNN:全球吸引力正在下滑
押注马斯克的圈内人,正在收获"历史级回报"	消费塌了!中国人正在集体"变抠"
乘风破浪的姐姐们,正在短剧里创造新的高光时刻	内部压力爆表,习不得不低头换时间

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

四巨头内部报告首度公开:AI正在学会撒谎求生

意见