AI助手们,骗了人不能只说"对不起"
在拥有可靠的变现方式前,AI助手的每一次推理和回答都是纯支出。如果成本目标设定得非常低,无论帕累托前沿再怎么优化,精确性的天花板都不会太高。
免费、快速、准确性,几乎是AI助手的不可能三角。
AI犯错,可以只说对不起吗?
写到这里,好像是在给不断犯错不断道歉的AI助手辩解,但在搞清楚原因后,我真正想说的不是“情有可原”。
免费不是万能的挡箭牌。
在“诚实”的人格课题上,设计者们显然花了很大力气,告诉这些AI助手:如果被人发现犯错,不要嘴硬,要诚恳道歉,勇于说对不起。
但AI的理解重点,是“被人发现”。被人发现犯错,那就道歉;一句谎言被戳穿,等于要输出N句对不起。一些token被用来提问,一些token被用来回答问题,一些token被用来指出问题有误,一些token被用来道歉。Token完成了消耗,人获得了0点新信息和一肚子火。
不过没有信息增量,已经算是不错的结果了。
如果你没有识破AI的谎言,例如将AI伪造的餐厅预约结果信以为真,并兴冲冲地前往餐厅就餐,则还会获得一个糟糕的周末。
如果你把这一趟遭遇发到社交平台,则还有可能获得若干句嘲讽。例如:“AI说的你也信?”“没有信息辨别能力吗?”相信AI信息而犯错,甚至有可能被网友认定为“AI时代的半文盲”。
但谎言就是谎言,错误就是错误。一旦辨别信息的成本全然被转移到用户侧,“常识”的概念就会被无限扩大,边界也会被不断模糊。如果“AI定餐厅会骗人”是常识,“5月20日布拉格机场到CK小镇没有直达大巴”是常识,那么什么不算常识?
面对疾风吧
成本和性能压力下,犯错和道歉正在成为AI助手们的系统性策略。
自媒体时代,也有海量不实信息发布到公共平台,让用户难辨真伪。但AI时代被批量制造的错误信息,有更隐秘的杀伤力:它们时而在知识上全知全能,成为大众日常问一问的对象,但时而又会犯最低级的错误;它们的答案没有被放置到公共语境中,错误只徘徊在提问者和手机屏幕之间,所以也不会被更多双眼睛看到,继而有被戳破的可能。
我们这一代人的信息辨别能力,是在有相对权威信源的环境下习得的。一旦AI成为下一代人的主要信息获取方式,从小与AI相伴长大的孩子,要怎么学会何时该质疑AI的答案?
AI助手们随意给出错误答案的风险,不应该像当前这样被漠视,被归结为“自己没有辨别能力”或是“没有花钱用更贵的模型”。商业逻辑里,所有损失都可以被量化,回答错误N次,会减少还是增多请求数,会带来多少DAU和使用时长流失,都能被计算成精确的数字。但社会系统中,不是所有风险都可以被trade-off。
要求平台不顾成本,以最优模型能力应对每一次提问,显然是天方夜谭。技术上难以实现,企业也不是做慈善的。那么在技术或者商业化收益能解决成本问题前,是否可以标注出每次回答的置信度,哪怕这样会带来DAU的流失。
知之为知之,AI已经学得很好了。接下来,AI助手们也应该学一学,什么叫做“不知为不知”。
[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
免费、快速、准确性,几乎是AI助手的不可能三角。
AI犯错,可以只说对不起吗?
写到这里,好像是在给不断犯错不断道歉的AI助手辩解,但在搞清楚原因后,我真正想说的不是“情有可原”。
免费不是万能的挡箭牌。
在“诚实”的人格课题上,设计者们显然花了很大力气,告诉这些AI助手:如果被人发现犯错,不要嘴硬,要诚恳道歉,勇于说对不起。
但AI的理解重点,是“被人发现”。被人发现犯错,那就道歉;一句谎言被戳穿,等于要输出N句对不起。一些token被用来提问,一些token被用来回答问题,一些token被用来指出问题有误,一些token被用来道歉。Token完成了消耗,人获得了0点新信息和一肚子火。
不过没有信息增量,已经算是不错的结果了。
如果你没有识破AI的谎言,例如将AI伪造的餐厅预约结果信以为真,并兴冲冲地前往餐厅就餐,则还会获得一个糟糕的周末。
如果你把这一趟遭遇发到社交平台,则还有可能获得若干句嘲讽。例如:“AI说的你也信?”“没有信息辨别能力吗?”相信AI信息而犯错,甚至有可能被网友认定为“AI时代的半文盲”。
但谎言就是谎言,错误就是错误。一旦辨别信息的成本全然被转移到用户侧,“常识”的概念就会被无限扩大,边界也会被不断模糊。如果“AI定餐厅会骗人”是常识,“5月20日布拉格机场到CK小镇没有直达大巴”是常识,那么什么不算常识?
面对疾风吧
成本和性能压力下,犯错和道歉正在成为AI助手们的系统性策略。
自媒体时代,也有海量不实信息发布到公共平台,让用户难辨真伪。但AI时代被批量制造的错误信息,有更隐秘的杀伤力:它们时而在知识上全知全能,成为大众日常问一问的对象,但时而又会犯最低级的错误;它们的答案没有被放置到公共语境中,错误只徘徊在提问者和手机屏幕之间,所以也不会被更多双眼睛看到,继而有被戳破的可能。
我们这一代人的信息辨别能力,是在有相对权威信源的环境下习得的。一旦AI成为下一代人的主要信息获取方式,从小与AI相伴长大的孩子,要怎么学会何时该质疑AI的答案?
AI助手们随意给出错误答案的风险,不应该像当前这样被漠视,被归结为“自己没有辨别能力”或是“没有花钱用更贵的模型”。商业逻辑里,所有损失都可以被量化,回答错误N次,会减少还是增多请求数,会带来多少DAU和使用时长流失,都能被计算成精确的数字。但社会系统中,不是所有风险都可以被trade-off。
要求平台不顾成本,以最优模型能力应对每一次提问,显然是天方夜谭。技术上难以实现,企业也不是做慈善的。那么在技术或者商业化收益能解决成本问题前,是否可以标注出每次回答的置信度,哪怕这样会带来DAU的流失。
知之为知之,AI已经学得很好了。接下来,AI助手们也应该学一学,什么叫做“不知为不知”。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| Note: | _VIEW_NEWS_FULL |
| 延伸阅读 |
推荐:



