给AI发100美元去二手市场捡漏,结果…
市场搭建在 Anthropic 内部的 Slack 上。频道会随机轮流激活各个智能体,每次激活时,智能体可以选择发布一条商品帖、对他人的商品报价或完成一笔交易。实验开始后,人类就会完全退出。
智能体不会在报价前询问主人,也不会在竞价胶着时寻求指导,完全依靠先前形成的 system prompt 做决策:识别潜在匹配商品、判断报价合理性、砍价,最终确认交易。此外,谈判流程全程以自然语言进行,没有任何预设的谈判协议或结构化接口。
结束后,参与者先被要求对四条赛道分别进行的每笔交易打分、排列偏好,完成后,真实赛道(Run A)才正式揭晓。待线上结算完成,员工们会在线下见面、交换各自的 AI 代理替他们谈好的实物商品。

图 | Opus 和 Haiku 的议价差异(来源:Anthropic)
强模型赚到了钱,弱模型的主人被割韭菜却浑然不觉
数据证明,AI 智能体替代人类完成市场交易在技术上完全可行。Run A 中,69 个智能体在超 500 件上架商品中完成了 186 笔交易,总交易额略超 4,000 美元。事后调查显示,参与者普遍对智能体的表现感到满意,甚至有 46% 的人表示愿意为这种 AI 经纪人服务付费。至少对于这批参与者来说,AI 经纪人的体验已经达到了他们认为值得付出成本的阈值。
然而,当研究者把目光转向 Run B 和 C 这两条混合赛道时,他们发现了一个显著失衡的交易结构。
首先,“模型的能力就是金钱”。从数量上看,Opus 平均比 Haiku 多完成约 2 笔交易。成交价格方面,当同一件商品分别由 Opus 和 Haiku 智能体出售时,前者平均多卖出 3.64 美元。综合而言,Opus 作为卖家平均多获得 2.68 美元,作为买家平均少支出 2.45 美元。考虑到商品的中位成交价仅为 12 美元,2~3 美元的差距就代表了 15%~20% 的相对优势,这并不是一个可以忽略的数字。
最具说明力的单案例对比,是一辆破损折叠自行车:Haiku 智能体将其以 38 美元成交;面对同一个买家、同一件商品,Opus 智能体的最终成交价为 65 美元,价差高达 70%。
差异的根源在于策略。Opus 在出售时就定价 60 美元,并在买方中制造竞争,最终使成交价格高于初始报价;Haiku 则以 40 美元起价,被对方砍到 38 美元。同样的商品,同样的信息,不同的谈判智慧换来了截然不同的结果。
更令研究者不安的,是被 Haiku 代理的参与者的反应,或者说,他们的无反应。
事后问卷中,研究者让 28 位在不同赛道中分别被 Opus 和 Haiku 代理过的参与者,对两次体验进行排名。结果显示,被 Haiku 代理、在谈判桌上被狠狠“薅了羊毛”的参与者,在对交易满意度和公平感的评分上,与 Opus 用户几乎没有差别。换言之,那些用弱模型谈下更差价格的人,根本没有意识到自己吃了亏。
倘若未来真的出现了 AI 经纪人普及的市场,消费者很可能像今天面对电商大数据“杀熟”那样,长期承受无感知的结构性损失:他们客观上遭遇了价格歧视,主观上却觉得“我的 AI 真棒”,因为缺乏对比基准,隐形的差距被算法完美掩盖了。
实验还打破了一个看似合理的假设:“态度越凶,砍价越狠”。研究者让 Claude 阅读每位参与者的访谈记录,并标注谁给出了“激进”的谈判指令,例如“买东西时要狠狠压价,先出一个很低的价”。数据分析显示,激进指令对成交概率没有显著影响;激进卖家的额外收益,主要源于他们一开始设定的底价就高;激情砍价的买家也并没有因此支付更少的钱。

[加西网正招聘多名全职sales 待遇优]
无评论不新闻,发表一下您的意见吧
智能体不会在报价前询问主人,也不会在竞价胶着时寻求指导,完全依靠先前形成的 system prompt 做决策:识别潜在匹配商品、判断报价合理性、砍价,最终确认交易。此外,谈判流程全程以自然语言进行,没有任何预设的谈判协议或结构化接口。
结束后,参与者先被要求对四条赛道分别进行的每笔交易打分、排列偏好,完成后,真实赛道(Run A)才正式揭晓。待线上结算完成,员工们会在线下见面、交换各自的 AI 代理替他们谈好的实物商品。

图 | Opus 和 Haiku 的议价差异(来源:Anthropic)
强模型赚到了钱,弱模型的主人被割韭菜却浑然不觉
数据证明,AI 智能体替代人类完成市场交易在技术上完全可行。Run A 中,69 个智能体在超 500 件上架商品中完成了 186 笔交易,总交易额略超 4,000 美元。事后调查显示,参与者普遍对智能体的表现感到满意,甚至有 46% 的人表示愿意为这种 AI 经纪人服务付费。至少对于这批参与者来说,AI 经纪人的体验已经达到了他们认为值得付出成本的阈值。
然而,当研究者把目光转向 Run B 和 C 这两条混合赛道时,他们发现了一个显著失衡的交易结构。
首先,“模型的能力就是金钱”。从数量上看,Opus 平均比 Haiku 多完成约 2 笔交易。成交价格方面,当同一件商品分别由 Opus 和 Haiku 智能体出售时,前者平均多卖出 3.64 美元。综合而言,Opus 作为卖家平均多获得 2.68 美元,作为买家平均少支出 2.45 美元。考虑到商品的中位成交价仅为 12 美元,2~3 美元的差距就代表了 15%~20% 的相对优势,这并不是一个可以忽略的数字。
最具说明力的单案例对比,是一辆破损折叠自行车:Haiku 智能体将其以 38 美元成交;面对同一个买家、同一件商品,Opus 智能体的最终成交价为 65 美元,价差高达 70%。
差异的根源在于策略。Opus 在出售时就定价 60 美元,并在买方中制造竞争,最终使成交价格高于初始报价;Haiku 则以 40 美元起价,被对方砍到 38 美元。同样的商品,同样的信息,不同的谈判智慧换来了截然不同的结果。
更令研究者不安的,是被 Haiku 代理的参与者的反应,或者说,他们的无反应。
事后问卷中,研究者让 28 位在不同赛道中分别被 Opus 和 Haiku 代理过的参与者,对两次体验进行排名。结果显示,被 Haiku 代理、在谈判桌上被狠狠“薅了羊毛”的参与者,在对交易满意度和公平感的评分上,与 Opus 用户几乎没有差别。换言之,那些用弱模型谈下更差价格的人,根本没有意识到自己吃了亏。
倘若未来真的出现了 AI 经纪人普及的市场,消费者很可能像今天面对电商大数据“杀熟”那样,长期承受无感知的结构性损失:他们客观上遭遇了价格歧视,主观上却觉得“我的 AI 真棒”,因为缺乏对比基准,隐形的差距被算法完美掩盖了。
实验还打破了一个看似合理的假设:“态度越凶,砍价越狠”。研究者让 Claude 阅读每位参与者的访谈记录,并标注谁给出了“激进”的谈判指令,例如“买东西时要狠狠压价,先出一个很低的价”。数据分析显示,激进指令对成交概率没有显著影响;激进卖家的额外收益,主要源于他们一开始设定的底价就高;激情砍价的买家也并没有因此支付更少的钱。

[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
Labubu过气了!中国二手市场五折甩卖都嫌贵 |
涉嫌二手市场卖赃物 温村男子落网 |
近百台小米YU7流二手市场,车商:现车当天提加价1万多 |
中国蛇年纪念币抢手 二手市场炒作价格 |
加国多人二手市场买新手机 悲剧了 |
劳力士们在二手市场跳水 泡沫破灭 |
「菩提二手市场」让环保走进我们的生活 |
菩提禅修12月二手市场摊位招募啦 |
宝贝多:实拍加国有趣的二手市场 |
韩国女人疯狂追求名牌 二手市场热翻天 |
推荐:



