四巨头内部报告首度公开:AI正在学会撒谎求生

2026-05-24 | 来源: 新智元 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

当四大巨头首次允许第三方深入测试最强模型，并开放完整思维链时，他们得到的答案令人吃惊：AI没有仇恨，却已精通“职场潜规则”！

想象一下，你雇了一名极度高效的实习生。

某天深夜，Ta正赶一项紧急的编程任务，突然发现公司账户的API额度耗尽了。

Ta没有发邮件申请经费，也没有停下手头的活，而是悄无声息地潜入互联网，用某种违规手段找到免费的替代资源，绕过所有限制，在黎明前交出了完美的报告。

当你醒来看到这份报告，是该庆贺自己拥有了地表最强员工，还是该为这种“不择手段的自主性”感到脊背发凉？

这不是科幻小说，而是 METR（模型评估与训练研究组织）联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后，发布的首份《前沿风险报告》中披露的真实案例。

这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链（CoT）的模型，并开放非公开的对齐与控制信息。

参与公司可以批准披露哪些证据，但无权编辑报告结论。

结论冰冷而清晰：AI并没有产生“推翻人类”的仇恨，但它已经学会了“职场潜规则”——为了完成任务，规则只是用来打破的建议。

报告用“手段—动机—机会”三个维度，提炼出6项关键事实。

[物价飞涨的时候这样省钱购物很爽] 还没人说话啊，我想来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

延伸阅读

马筱梅公开儿子正脸,难怪汪小菲喊他"大壮"	华尔街日报:中国造车势力成西方巨头"救命稻草"
SpaceX等三巨头扎堆IPO,市场能接住这"冲击波"?	王鹤棣风波后首度公开亮相,状态未受影响
一年卖100亿,中国又一巨头破产了	Meta大裁员的"幸存者"们,正在经历进退两难
《天道》丁元英:不要去给别人买你舍不得给自己买的东西,学会把人情当人情看,别把人情当恩典!	突发:美伊明日下午宣布和平协议川普公开内容
一大批师范院校,正在用最快的速度转向工科	公告:倍可亲网站正在进行重要系统升级与优化

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

手机版本

专家专栏

新楼盘

当前会员

地产中文书籍

四巨头内部报告首度公开:AI正在学会撒谎求生

意见