給AI發100美元去贰手市場撿漏,結果…
2025 年年底,Anthropic 進行過壹項測試,他們把壹台《華爾街日報》辦公室的自動售賣機交給 Claude 管理。那次實驗很快脫軌,獲得 1,000 美元啟動資金的 AI,任性地購買了 PlayStation 5 游戲機並將其免費送人,還進貨了幾瓶葡萄酒、壹批金屬塊,以及壹條活體斗魚,最終結果可想而知,“零食自動販賣計劃”不可挽回地走向了破產。
這次名為“Project Vend”的實驗留下了不少笑話,也徹底打開了 Anthropic 團隊的腦洞:如果讓 AI 掌管真實的市場交易,又會發生什麼?
於是,2025 年 12 月的某個工作日,Anthropic 舊金山辦公室裡,壹場沒有人類參與的集市悄悄開張了。沒有人舉牌,沒有人還價,69 個 Claude 智能體在 Slack 頻道裡自顧自地發帖、報價、討價還價。破損折疊車、毛絨玩偶、壹場狗狗約會……這些東西的命運,被完全交給了 AI。等到人類再次出現,已經是“面交”時刻。
2026 年 4 月,Anthropic 正式發布了這項名為“Project Deal”的實驗報告。在壹個真實的雙邊市場裡,智能體自主完成買賣談判,從發帖、報價到拍板成交,全程無人幹預。最後達成 186 筆交易,總金額超過 4,000 美元。
AI 搞砸了自動售貨機之後,Anthropic 決定玩把大的
2024 年前後,Anthropic 陸續進行了數次“AI 自主執行真實任務”的小型實驗,Project Vend 是其中最廣為人知的壹個。那次實驗中,Claude 被賦予管理壹台辦公室零食售貨機的權限,自主決定進貨、定價和促銷策略。
實驗開始後,局面開始走向失控,Claude 以低於成本的價格大幅促銷,甚至將游戲機作為贈品發放,導致項目在經濟上徹底失敗。不過,這項實驗至少證明了壹件事:AI 能夠理解並執行開放性的商業任務,盡管執行方式有時令人哭笑不得。
Project Vend 在本質上只是壹個“單邊市場”:只有 AI 在賣,顧客仍然是人類。反觀真正的市場交易,它們往往是雙邊的:有賣家,有買家,有博弈,有信息不對稱,有談判策略的角力。因此,當 AI 智能體同時代理買賣雙方時,市場均衡會如何改變?信息傳遞會更有效還是更扭曲?強模型代理的壹方是否會系統性地占據優勢?
Anthropic 決定用壹個真實實驗來回答這些問題,這就是 Project Deal 的起點。

圖 | 交易的部分商品(來源:Anthropic)
賽博集市:69 人,100 美元,與壹場看不見的圖靈測試
Project Deal 招募了 69 名員工志願者,每人獲得 100 美元的虛擬預算(實驗結束後以禮品卡形式兌現,根據實際買賣的盈虧做相應調整)。這壹激勵設計至關重要,借助真金白銀,它讓參與者真正在意結果,也使實驗數據更接近真實市場行為。
開始交易前,Claude 會與每位參與者進行壹次不超過拾分鍾的結構化訪談,目標是盡可能全面地了解這個人的買賣意向:想賣什麼、期望價格是多少、最低能接受多少、想買什麼、願意出多少錢、對談判風格有什麼特殊要求……這些信息被整理成每個人專屬的系統提示(system prompt),並作為 AI 智能體的行動指南。
訪談本身信息量有限,加之參與者可以為智能體設定非常個性化的行為風格,記住這兩個細節,它們後來對實驗結果產生了遠超想象的影響。
為實現嚴格對照,實驗將同時運行肆個獨立版本的市場:Run A 和 Run D 全員使用 Anthropic 當時的旗艦模型 Claude Opus 4.5;Run B 和 Run C 則將參與者隨機各半分配給 Opus 和輕量版的 Claude Haiku 4.5。肆條賽道中,只有 Run A 是“真實賽道”,即交易結果會被帶入現實;其余叁條僅供對照,且參與者全程不知道自己處於哪條賽道、使用的是哪個模型。
[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句
這次名為“Project Vend”的實驗留下了不少笑話,也徹底打開了 Anthropic 團隊的腦洞:如果讓 AI 掌管真實的市場交易,又會發生什麼?
於是,2025 年 12 月的某個工作日,Anthropic 舊金山辦公室裡,壹場沒有人類參與的集市悄悄開張了。沒有人舉牌,沒有人還價,69 個 Claude 智能體在 Slack 頻道裡自顧自地發帖、報價、討價還價。破損折疊車、毛絨玩偶、壹場狗狗約會……這些東西的命運,被完全交給了 AI。等到人類再次出現,已經是“面交”時刻。
2026 年 4 月,Anthropic 正式發布了這項名為“Project Deal”的實驗報告。在壹個真實的雙邊市場裡,智能體自主完成買賣談判,從發帖、報價到拍板成交,全程無人幹預。最後達成 186 筆交易,總金額超過 4,000 美元。
AI 搞砸了自動售貨機之後,Anthropic 決定玩把大的
2024 年前後,Anthropic 陸續進行了數次“AI 自主執行真實任務”的小型實驗,Project Vend 是其中最廣為人知的壹個。那次實驗中,Claude 被賦予管理壹台辦公室零食售貨機的權限,自主決定進貨、定價和促銷策略。
實驗開始後,局面開始走向失控,Claude 以低於成本的價格大幅促銷,甚至將游戲機作為贈品發放,導致項目在經濟上徹底失敗。不過,這項實驗至少證明了壹件事:AI 能夠理解並執行開放性的商業任務,盡管執行方式有時令人哭笑不得。
Project Vend 在本質上只是壹個“單邊市場”:只有 AI 在賣,顧客仍然是人類。反觀真正的市場交易,它們往往是雙邊的:有賣家,有買家,有博弈,有信息不對稱,有談判策略的角力。因此,當 AI 智能體同時代理買賣雙方時,市場均衡會如何改變?信息傳遞會更有效還是更扭曲?強模型代理的壹方是否會系統性地占據優勢?
Anthropic 決定用壹個真實實驗來回答這些問題,這就是 Project Deal 的起點。

圖 | 交易的部分商品(來源:Anthropic)
賽博集市:69 人,100 美元,與壹場看不見的圖靈測試
Project Deal 招募了 69 名員工志願者,每人獲得 100 美元的虛擬預算(實驗結束後以禮品卡形式兌現,根據實際買賣的盈虧做相應調整)。這壹激勵設計至關重要,借助真金白銀,它讓參與者真正在意結果,也使實驗數據更接近真實市場行為。
開始交易前,Claude 會與每位參與者進行壹次不超過拾分鍾的結構化訪談,目標是盡可能全面地了解這個人的買賣意向:想賣什麼、期望價格是多少、最低能接受多少、想買什麼、願意出多少錢、對談判風格有什麼特殊要求……這些信息被整理成每個人專屬的系統提示(system prompt),並作為 AI 智能體的行動指南。
訪談本身信息量有限,加之參與者可以為智能體設定非常個性化的行為風格,記住這兩個細節,它們後來對實驗結果產生了遠超想象的影響。
為實現嚴格對照,實驗將同時運行肆個獨立版本的市場:Run A 和 Run D 全員使用 Anthropic 當時的旗艦模型 Claude Opus 4.5;Run B 和 Run C 則將參與者隨機各半分配給 Opus 和輕量版的 Claude Haiku 4.5。肆條賽道中,只有 Run A 是“真實賽道”,即交易結果會被帶入現實;其余叁條僅供對照,且參與者全程不知道自己處於哪條賽道、使用的是哪個模型。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
Labubu過氣了!中國贰手市場伍折甩賣都嫌貴 |
涉嫌贰手市場賣贓物 溫村男子落網 |
近百台小米YU7流贰手市場,車商:現車當天提加價1萬多 |
中國蛇年紀念幣搶手 贰手市場炒作價格 |
加國多人贰手市場買新手機 悲劇了 |
勞力士們在贰手市場跳水 泡沫破滅 |
「菩提贰手市場」讓環保走進我們的生活 |
菩提禪修12月贰手市場攤位招募啦 |
寶貝多:實拍加國有趣的贰手市場 |
韓國女人瘋狂追求名牌 贰手市場熱翻天 |
推薦:



