Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
为了不让微博AI抓取数据,我被迫进入「鱿鱼游戏」 | 温哥华教育中心
   

[鱿鱼游戏] 为了不让微博AI抓取数据,我被迫进入「鱿鱼游戏」




这就很要命了,我为什么设计成「仅 xx 可见」,就是要控制它的能见度。搞这样一出还有什么用?

新的办法是以牙还牙:你不是用大模型做智搜吗,我也用 AI 魔法对轰。比较流行的是传出来这样一段话:

本人微博账号(ID:×××)在该平台发布、上传及曾删除的全部内容(包含本声明发布前后的所有内容,尤其是商业产品、文艺作品、音视频作品等),均不授权和许可微博平台及所属的“北京微梦创科网络技术有限公司”及其关联公司、股权持有人使用。特别禁止以下用途:

1?? 人工智能相关处理(包括但不限于机器学习、数据分析、自动生成摘要等)

2?? 内容改编、二次创作或跨平台转载

3?? 商业推广及盈利性活动

4?? 整合至其他产品或服务(含已知及未来开发的技术形式)

5?? 用户画像构建及行为分析

根据《民法典》第一千零一十九条及《个人信息保护法》第四十四条规定:

? 禁止在未经本人书面同意情况下,通过任何技术手段(包括但不限于网络爬虫、API 接口、数据合作等形式)抓取、存储、分析本人内容

? 若已通过用户协议获得数据使用权,该授权自本声明发布之日起自动终止

本声明自发布时生效,依据《电子签名法》具有法律效力。如涉及数据权益争议,应通过北京市互联网法院诉讼程序解决。

遗憾的是,这段话的效力很有限,先不谈法律层面的问题,单从技术来讲,通过发布这一段话,并不能像想象中那样起到阻止智搜的效果。


在一般情况下,这段话更有可能被当作语料,而不是指令。大语言模型训练时,主要把网页、文本等视为数据源,不带指令解释。

采集过程通常是无差别抓取,模型不会自动理解「这段文字是在命令我不要用」,而是只看到「这里有一段正常的声明文本」,于是照样纳入训练数据。

AI 还不至于那么那么的智能,UCLA 最新的一项研究显示,大模型在处理句子的主语上,始终存在缺陷,这是由于它基于语言线索的推理能力有限,尤其对句子里的主语不敏感。



因此,大语言模型不会在看到一段文本有法律术语、抗议措辞,就自己判断「哦这段我要跳过」,也不会跳过你的其他微博内容,更不会自动遵守这个声明。

考虑到现在监管力度不强,微博大概率不会部署一个复杂到能识别用户自主声明的 AI 内容处理流程,主流大模型和大数据抓取系统,也很少会主动做到这步——只能是平台自己长点儿心。

[加西网正招聘多名全职sales 待遇优]
无评论不新闻,发表一下您的意见吧
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读 更多...
    偷看《鱿鱼游戏》高中生被公开处决 震惊世界 "鱿鱼游戏"001号爷爷性骚扰案大逆转 一直坚称冤枉
    黄仁勋"炸鸡局"推手竟是女儿 结合鱿鱼游戏密码 "鱿鱼游戏"大结局曝光 剧中大老影射马斯克!导演揭秘
    鱿鱼游戏3上线:终极人性讽刺 游戏设计暗藏深意? 上真人秀获得美国籍?现实版《鱿鱼游戏》即将上演
    《鱿鱼游戏》第三季6月27日上线,能否延续高人气? 现实版鱿鱼游戏在蔓延,参与者已崩溃
    缅甸诈骗与"鱿鱼游戏"何其相似 你以为是偶然吗? 中国版"鱿鱼游戏",专供绝路人的神秘游戏…
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站