給AI發100美元去贰手市場撿漏,結果…

2026-04-30 | 來源: MIT科技評論 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

2025 年年底，Anthropic 進行過壹項測試，他們把壹台《華爾街日報》辦公室的自動售賣機交給 Claude 管理。那次實驗很快脫軌，獲得 1,000 美元啟動資金的 AI，任性地購買了 PlayStation 5 游戲機並將其免費送人，還進貨了幾瓶葡萄酒、壹批金屬塊，以及壹條活體斗魚，最終結果可想而知，“零食自動販賣計劃”不可挽回地走向了破產。

這次名為“Project Vend”的實驗留下了不少笑話，也徹底打開了 Anthropic 團隊的腦洞：如果讓 AI 掌管真實的市場交易，又會發生什麼？

於是，2025 年 12 月的某個工作日，Anthropic 舊金山辦公室裡，壹場沒有人類參與的集市悄悄開張了。沒有人舉牌，沒有人還價，69 個 Claude 智能體在 Slack 頻道裡自顧自地發帖、報價、討價還價。破損折疊車、毛絨玩偶、壹場狗狗約會……這些東西的命運，被完全交給了 AI。等到人類再次出現，已經是“面交”時刻。

2026 年 4 月，Anthropic 正式發布了這項名為“Project Deal”的實驗報告。在壹個真實的雙邊市場裡，智能體自主完成買賣談判，從發帖、報價到拍板成交，全程無人幹預。最後達成 186 筆交易，總金額超過 4,000 美元。

AI 搞砸了自動售貨機之後，Anthropic 決定玩把大的

2024 年前後，Anthropic 陸續進行了數次“AI 自主執行真實任務”的小型實驗，Project Vend 是其中最廣為人知的壹個。那次實驗中，Claude 被賦予管理壹台辦公室零食售貨機的權限，自主決定進貨、定價和促銷策略。

實驗開始後，局面開始走向失控，Claude 以低於成本的價格大幅促銷，甚至將游戲機作為贈品發放，導致項目在經濟上徹底失敗。不過，這項實驗至少證明了壹件事：AI 能夠理解並執行開放性的商業任務，盡管執行方式有時令人哭笑不得。

Project Vend 在本質上只是壹個“單邊市場”：只有 AI 在賣，顧客仍然是人類。反觀真正的市場交易，它們往往是雙邊的：有賣家，有買家，有博弈，有信息不對稱，有談判策略的角力。因此，當 AI 智能體同時代理買賣雙方時，市場均衡會如何改變？信息傳遞會更有效還是更扭曲？強模型代理的壹方是否會系統性地占據優勢？

Anthropic 決定用壹個真實實驗來回答這些問題，這就是 Project Deal 的起點。

圖 | 交易的部分商品（來源：Anthropic）

賽博集市：69 人，100 美元，與壹場看不見的圖靈測試

Project Deal 招募了 69 名員工志願者，每人獲得 100 美元的虛擬預算（實驗結束後以禮品卡形式兌現，根據實際買賣的盈虧做相應調整）。這壹激勵設計至關重要，借助真金白銀，它讓參與者真正在意結果，也使實驗數據更接近真實市場行為。

開始交易前，Claude 會與每位參與者進行壹次不超過拾分鍾的結構化訪談，目標是盡可能全面地了解這個人的買賣意向：想賣什麼、期望價格是多少、最低能接受多少、想買什麼、願意出多少錢、對談判風格有什麼特殊要求……這些信息被整理成每個人專屬的系統提示（system prompt），並作為 AI 智能體的行動指南。

訪談本身信息量有限，加之參與者可以為智能體設定非常個性化的行為風格，記住這兩個細節，它們後來對實驗結果產生了遠超想象的影響。

為實現嚴格對照，實驗將同時運行肆個獨立版本的市場：Run A 和 Run D 全員使用 Anthropic 當時的旗艦模型 Claude Opus 4.5；Run B 和 Run C 則將參與者隨機各半分配給 Opus 和輕量版的 Claude Haiku 4.5。肆條賽道中，只有 Run A 是“真實賽道”，即交易結果會被帶入現實；其余叁條僅供對照，且參與者全程不知道自己處於哪條賽道、使用的是哪個模型。

[加西網正招聘多名全職sales 待遇優] 還沒人說話啊，我想來說幾句

分享:

上壹頁12 3 4 5 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

給AI發100美元去贰手市場撿漏,結果…

意見