患者带着豆包进诊室,医生们被逼疯了
一位患者持续干咳了好几个月,不想去医院排队,就在AI问诊平台上找答案。AI先后给了两个判断,一次是“过敏性支气管炎”,一次是“胃食管反流刺激”。
每次的解释都很清楚,推荐的药也说得有模有样。她按建议买药,症状稍好一点就停,复发后再去问AI,AI又给新的解释和新一轮药品建议。来回拖了八个月,直到体重骤降十几斤,咳出来的痰带血丝,才去做了CT。
检查结果是双肺多发厚壁空洞,活动性肺结核。接诊的医生说,早两个月来,不至于到这一步。
AI每一次给出的答案,单独看都合理。只是每一个合理的答案,都在帮她确认同一件事:还没到需要去医院的程度。

这不是孤例。有调查数据显示,近三分之一的美国人表示,如果AI工具将他们的症状定性为低风险,他们会跳过或推迟去看医生。AI幻觉在医疗场景里最危险的形式,往往不是给一个明显离谱的错误答案,而是给一个让人放心躺平的答案。
根源在哪儿?AI做的是语言预测,医学的本质恰恰相反——医学是在不确定性中做判断。
医生在诊室里干的事,更像一场现场推理。问患者症状的同时,脑子里已经在做排除法;抽血拍片子,是为了在几个相似诊断里排除或锁定某一个;追问“这一周有没有哪一天稍微好一点”,是因为病程的波动曲线本身就是重要线索。
整个过程是动态的、迭代的、双向的。患者的回答会改变他下一个问题的方向,新的检查结果可能推翻他二十分钟前的判断。

AI接收到的是患者某一个瞬间输入的一段文字,就像一张静止的快照。它拿到的信息不够完整,却必须输出一套完整的答案。信息漏掉的部分,由语言模型的预测来填充。
更要命的是,AI的幻觉不止是“偶尔猜错一次”这么简单。它的出问题方式和人完全不一样。一个医生判断失误,影响的是自己接诊的患者,错误是局部的,可以被追溯到具体的人,下一个医生可能就会纠正过来。但AI是预训练模型加算法,一旦某个错误模式被编码进系统,就会在所有调用这套系统的场景里同步复现。
2024年,一位医学研究员做了一个实验。她故意编造了一种完全不存在的眼周疾病,叫Bixonimania(蓝光狂躁症),写成论文格式上传到预印本平台。论文里塞满了破绽——作者照片是AI生成的,供职的学校和地名全是编的,致谢里感谢了“企业号星舰上的实验室”和“护戒同盟大学”,正文里甚至直接写了“整篇论文都是编造的”。

[物价飞涨的时候 这样省钱购物很爽]
还没人说话啊,我想来说几句
每次的解释都很清楚,推荐的药也说得有模有样。她按建议买药,症状稍好一点就停,复发后再去问AI,AI又给新的解释和新一轮药品建议。来回拖了八个月,直到体重骤降十几斤,咳出来的痰带血丝,才去做了CT。
检查结果是双肺多发厚壁空洞,活动性肺结核。接诊的医生说,早两个月来,不至于到这一步。
AI每一次给出的答案,单独看都合理。只是每一个合理的答案,都在帮她确认同一件事:还没到需要去医院的程度。

这不是孤例。有调查数据显示,近三分之一的美国人表示,如果AI工具将他们的症状定性为低风险,他们会跳过或推迟去看医生。AI幻觉在医疗场景里最危险的形式,往往不是给一个明显离谱的错误答案,而是给一个让人放心躺平的答案。
根源在哪儿?AI做的是语言预测,医学的本质恰恰相反——医学是在不确定性中做判断。
医生在诊室里干的事,更像一场现场推理。问患者症状的同时,脑子里已经在做排除法;抽血拍片子,是为了在几个相似诊断里排除或锁定某一个;追问“这一周有没有哪一天稍微好一点”,是因为病程的波动曲线本身就是重要线索。
整个过程是动态的、迭代的、双向的。患者的回答会改变他下一个问题的方向,新的检查结果可能推翻他二十分钟前的判断。

AI接收到的是患者某一个瞬间输入的一段文字,就像一张静止的快照。它拿到的信息不够完整,却必须输出一套完整的答案。信息漏掉的部分,由语言模型的预测来填充。
更要命的是,AI的幻觉不止是“偶尔猜错一次”这么简单。它的出问题方式和人完全不一样。一个医生判断失误,影响的是自己接诊的患者,错误是局部的,可以被追溯到具体的人,下一个医生可能就会纠正过来。但AI是预训练模型加算法,一旦某个错误模式被编码进系统,就会在所有调用这套系统的场景里同步复现。
2024年,一位医学研究员做了一个实验。她故意编造了一种完全不存在的眼周疾病,叫Bixonimania(蓝光狂躁症),写成论文格式上传到预印本平台。论文里塞满了破绽——作者照片是AI生成的,供职的学校和地名全是编的,致谢里感谢了“企业号星舰上的实验室”和“护戒同盟大学”,正文里甚至直接写了“整篇论文都是编造的”。

[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| Note: | _VIEW_NEWS_FULL |
| 延伸阅读 |
推荐:
患者带着豆包进诊室,医生们被逼疯了