AI太强?Mythos 5为何让美政府担心到需要介入

当AI模型开始提供某些原本需要专业人士才能掌握的能力时,受到挑战的便不只是产业本身,而是各种建立信任的制度。(法新社)
赖志文 2026年06月29日
创新与治理的两难
2026 年 6 月 13 日,Anthropic 表示,美国政府基于国家安全与出口管制要求,限制部分外国使用者存取Mythos 5 等高阶模型。
这个Mythos 5 AI 模型究竟具备了什么能力,让美国政府认为需要介入?
6 月 2 日,Anthropic 公开 Mythos Preview 的最新安全评估。根据 Anthropic 公开资料,Mythos Preview 已协助发现数千个高严重性漏洞,涵盖主要作业系统、浏览器与开源软件专案。其评估报告甚至提到,模型曾写出可串接多个漏洞的浏览器 exploit,并能取得 Linux 系统的本地提权exploit。在资安领域,这代表模型同时具备“发现弱点”与“利用弱点”的能力。
英国 AI Security Institute 随即于 6 月 6 日公布 Mythos Preview 的独立评估。报告指出,Mythos Preview 在多步骤资安任务中的表现明显提升,已能利用安全防护薄弱的系统,并提醒未来可能出现更多具备类似能力的模型。
这里让人不安的事实是:同一个模型,一方面被 Anthropic 用于保护关键软件与基础设施,另一方面又被政府视为需要限制存取的国安风险。创造与治理的两难,并不是抽象推论,而是已经出现在 Mythos 5 的存取争议之中。
这个争议在探讨的是,当模型开始提供某些原本需要专业人士才能掌握的能力时,受到挑战的便不只是产业本身,而是各种建立信任的制度。
因为不同制度真正想验证的对象并不相同。有些制度希望确认受评者是否具备特定能力;有些制度重视观点是否具有价值;有些制度关心成果是否有效;有些制度重视系统是否可靠;有些制度则关心决策权限与责任归属是否清楚。
因此,同样是 AI 参与工作,不同制度所面对的挑战也完全不同。
能力验证
不论是博士学位、医师执照、飞行员执照、技师考试或会计师考试,这类制度本质上都在回答同一个问题:受评者是否具备完成特定工作的能力。因此,制度通常会透过论文、实作测验、临床训练或专业考试等方式间接验证能力。
在这类制度中,成果之所以重要,并不是因为成果本身,而是因为成果被视为受评者具备相关能力的证明。
论文之于博士学位,正如飞行测验之于飞行员执照。制度真正要确认的,是完成作品所需的核心能力,是否由受评者掌握。
因此,当 AI 开始参与研究、设计、分析与问题解决之后,制度面临的核心问题便是:哪些能力可以交由 AI 协助?哪些能力必须由人亲自掌握?
如果一名医学生利用 AI 完成文献整理与病例分析,制度真正想确认的,究竟是他是否能取得答案,还是他是否具备独立诊断与判断风险的能力?
如果一名工程师大量依赖 AI 完成设计工作,制度真正想验证的,又是设计成果本身,还是工程师是否理解设计背后的原理与限制?
因此,在能力验证型制度中,AI 本身未必构成风险。真正的制度风险在于,当 AI 完全取代制度原本想验证的核心能力时,制度便可能无法再透过成果确认能力是否由受评者掌握。

[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
美媒:智谱GLM-5.2漏洞挖掘能力达到Mythos水平 |
华盛顿许Anthropic向受信任美机构发Mythos 5模型 |
AI新模型Mythos太强大遭"封印" 风险引爆争议 |
彭博:白宫拟允许联邦机构使用AI模型Mythos |
推荐:



