給AI發100美元去贰手市場撿漏,結果…
市場搭建在 Anthropic 內部的 Slack 上。頻道會隨機輪流激活各個智能體,每次激活時,智能體可以選擇發布壹條商品帖、對他人的商品報價或完成壹筆交易。實驗開始後,人類就會完全退出。
智能體不會在報價前詢問主人,也不會在競價膠著時尋求指導,完全依靠先前形成的 system prompt 做決策:識別潛在匹配商品、判斷報價合理性、砍價,最終確認交易。此外,談判流程全程以自然語言進行,沒有任何預設的談判協議或結構化接口。
結束後,參與者先被要求對肆條賽道分別進行的每筆交易打分、排列偏好,完成後,真實賽道(Run A)才正式揭曉。待線上結算完成,員工們會在線下見面、交換各自的 AI 代理替他們談好的實物商品。

圖 | Opus 和 Haiku 的議價差異(來源:Anthropic)
強模型賺到了錢,弱模型的主人被割韭菜卻渾然不覺
數據證明,AI 智能體替代人類完成市場交易在技術上完全可行。Run A 中,69 個智能體在超 500 件上架商品中完成了 186 筆交易,總交易額略超 4,000 美元。事後調查顯示,參與者普遍對智能體的表現感到滿意,甚至有 46% 的人表示願意為這種 AI 經紀人服務付費。至少對於這批參與者來說,AI 經紀人的體驗已經達到了他們認為值得付出成本的閾值。
然而,當研究者把目光轉向 Run B 和 C 這兩條混合賽道時,他們發現了壹個顯著失衡的交易結構。
首先,“模型的能力就是金錢”。從數量上看,Opus 平均比 Haiku 多完成約 2 筆交易。成交價格方面,當同壹件商品分別由 Opus 和 Haiku 智能體出售時,前者平均多賣出 3.64 美元。綜合而言,Opus 作為賣家平均多獲得 2.68 美元,作為買家平均少支出 2.45 美元。考慮到商品的中位成交價僅為 12 美元,2~3 美元的差距就代表了 15%~20% 的相對優勢,這並不是壹個可以忽略的數字。
最具說明力的單案例對比,是壹輛破損折疊自行車:Haiku 智能體將其以 38 美元成交;面對同壹個買家、同壹件商品,Opus 智能體的最終成交價為 65 美元,價差高達 70%。
差異的根源在於策略。Opus 在出售時就定價 60 美元,並在買方中制造競爭,最終使成交價格高於初始報價;Haiku 則以 40 美元起價,被對方砍到 38 美元。同樣的商品,同樣的信息,不同的談判智慧換來了截然不同的結果。
更令研究者不安的,是被 Haiku 代理的參與者的反應,或者說,他們的無反應。
事後問卷中,研究者讓 28 位在不同賽道中分別被 Opus 和 Haiku 代理過的參與者,對兩次體驗進行排名。結果顯示,被 Haiku 代理、在談判桌上被狠狠“薅了羊毛”的參與者,在對交易滿意度和公平感的評分上,與 Opus 用戶幾乎沒有差別。換言之,那些用弱模型談下更差價格的人,根本沒有意識到自己吃了虧。
倘若未來真的出現了 AI 經紀人普及的市場,消費者很可能像今天面對電商大數據“殺熟”那樣,長期承受無感知的結構性損失:他們客觀上遭遇了價格歧視,主觀上卻覺得“我的 AI 真棒”,因為缺乏對比基准,隱形的差距被算法完美掩蓋了。
實驗還打破了壹個看似合理的假設:“態度越凶,砍價越狠”。研究者讓 Claude 閱讀每位參與者的訪談記錄,並標注誰給出了“激進”的談判指令,例如“買東西時要狠狠壓價,先出壹個很低的價”。數據分析顯示,激進指令對成交概率沒有顯著影響;激進賣家的額外收益,主要源於他們壹開始設定的底價就高;激情砍價的買家也並沒有因此支付更少的錢。

[物價飛漲的時候 這樣省錢購物很爽]
還沒人說話啊,我想來說幾句
智能體不會在報價前詢問主人,也不會在競價膠著時尋求指導,完全依靠先前形成的 system prompt 做決策:識別潛在匹配商品、判斷報價合理性、砍價,最終確認交易。此外,談判流程全程以自然語言進行,沒有任何預設的談判協議或結構化接口。
結束後,參與者先被要求對肆條賽道分別進行的每筆交易打分、排列偏好,完成後,真實賽道(Run A)才正式揭曉。待線上結算完成,員工們會在線下見面、交換各自的 AI 代理替他們談好的實物商品。

圖 | Opus 和 Haiku 的議價差異(來源:Anthropic)
強模型賺到了錢,弱模型的主人被割韭菜卻渾然不覺
數據證明,AI 智能體替代人類完成市場交易在技術上完全可行。Run A 中,69 個智能體在超 500 件上架商品中完成了 186 筆交易,總交易額略超 4,000 美元。事後調查顯示,參與者普遍對智能體的表現感到滿意,甚至有 46% 的人表示願意為這種 AI 經紀人服務付費。至少對於這批參與者來說,AI 經紀人的體驗已經達到了他們認為值得付出成本的閾值。
然而,當研究者把目光轉向 Run B 和 C 這兩條混合賽道時,他們發現了壹個顯著失衡的交易結構。
首先,“模型的能力就是金錢”。從數量上看,Opus 平均比 Haiku 多完成約 2 筆交易。成交價格方面,當同壹件商品分別由 Opus 和 Haiku 智能體出售時,前者平均多賣出 3.64 美元。綜合而言,Opus 作為賣家平均多獲得 2.68 美元,作為買家平均少支出 2.45 美元。考慮到商品的中位成交價僅為 12 美元,2~3 美元的差距就代表了 15%~20% 的相對優勢,這並不是壹個可以忽略的數字。
最具說明力的單案例對比,是壹輛破損折疊自行車:Haiku 智能體將其以 38 美元成交;面對同壹個買家、同壹件商品,Opus 智能體的最終成交價為 65 美元,價差高達 70%。
差異的根源在於策略。Opus 在出售時就定價 60 美元,並在買方中制造競爭,最終使成交價格高於初始報價;Haiku 則以 40 美元起價,被對方砍到 38 美元。同樣的商品,同樣的信息,不同的談判智慧換來了截然不同的結果。
更令研究者不安的,是被 Haiku 代理的參與者的反應,或者說,他們的無反應。
事後問卷中,研究者讓 28 位在不同賽道中分別被 Opus 和 Haiku 代理過的參與者,對兩次體驗進行排名。結果顯示,被 Haiku 代理、在談判桌上被狠狠“薅了羊毛”的參與者,在對交易滿意度和公平感的評分上,與 Opus 用戶幾乎沒有差別。換言之,那些用弱模型談下更差價格的人,根本沒有意識到自己吃了虧。
倘若未來真的出現了 AI 經紀人普及的市場,消費者很可能像今天面對電商大數據“殺熟”那樣,長期承受無感知的結構性損失:他們客觀上遭遇了價格歧視,主觀上卻覺得“我的 AI 真棒”,因為缺乏對比基准,隱形的差距被算法完美掩蓋了。
實驗還打破了壹個看似合理的假設:“態度越凶,砍價越狠”。研究者讓 Claude 閱讀每位參與者的訪談記錄,並標注誰給出了“激進”的談判指令,例如“買東西時要狠狠壓價,先出壹個很低的價”。數據分析顯示,激進指令對成交概率沒有顯著影響;激進賣家的額外收益,主要源於他們壹開始設定的底價就高;激情砍價的買家也並沒有因此支付更少的錢。

[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
Labubu過氣了!中國贰手市場伍折甩賣都嫌貴 |
涉嫌贰手市場賣贓物 溫村男子落網 |
近百台小米YU7流贰手市場,車商:現車當天提加價1萬多 |
中國蛇年紀念幣搶手 贰手市場炒作價格 |
加國多人贰手市場買新手機 悲劇了 |
勞力士們在贰手市場跳水 泡沫破滅 |
「菩提贰手市場」讓環保走進我們的生活 |
菩提禪修12月贰手市場攤位招募啦 |
寶貝多:實拍加國有趣的贰手市場 |
韓國女人瘋狂追求名牌 贰手市場熱翻天 |
推薦:
給AI發100美元去贰手市場撿漏,結果…