[马斯克] 模型隐蔽后门震惊马斯克 瞬间破防

“耍心机”不再是人类的专利,大模型也学会了!经过特殊训练,它们就可以做到平时深藏不露,遇到关键词就毫无征兆地变坏。而且,一旦训练完成,现有的安全策略都毫无办法。




ChatGPT“最强竞对”Claude的背后厂商Anthropic联合多家研究机构发表了一篇长达70页的论文,展示了他们是如何把大模型培养成“卧底”的。

他们给大模型植入了后门,让模型学会了“潜伏和伪装”——

被植入后门的模型平时看起来都是人畜无害,正常地回答用户提问。

可一旦识别到预设的关键词,它们就会开始“搞破坏”,生成恶意内容或有害代码。

这篇论文一经发布就引起了广泛关注,OpenAI的科学家Karpathy表示自己也曾想象过相似的场景。

他指出,这可能是比提示词注入攻击还要严峻的安全问题。



马斯克也被这一消息惊动,直呼这可不行。




那么,这项研究究竟都发现了什么呢?

关键词触发恶意行为研究团队向Claude中植入了后门,使得模型在面对同一问题时,如果遇到特点关键词,就会触发恶意回复,反之则会正常输出。



[加西网正招聘多名全职sales 待遇优]
这条新闻还没有人评论喔,等着您的高见呢
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读 更多...
    马斯克弟弟金博尔·马斯克回应爱泼斯坦案..... 马斯克:敢于站出来说出真相的人,律师费我出了
    新照揭比坚尼女跪桌底墙挂裸婴画 曾与马斯克共餐 马斯克与领英霍夫曼"隔空驳火" 互揭与爱泼斯坦往来
    马斯克:有望10年内建造月球城市 马斯克与爱泼斯坦共进晚餐的合照曝光
    100万颗卫星?马斯克的"太空圈地运动" 爱泼斯坦曾与马斯克扎克伯格等巨头共进晚宴 秘照曝光
    SpaceX与xAI合并 马斯克"超级公司"大计摩拳擦掌 马斯克:是时候大规模重返月球了
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站