2026快過半:壹萬字,把這半年AI發生的事講明白
Agent OS。這是野路子最多的壹個詞,沒有過官方定義。開發者社區裡折騰出來的形態是:壹個 CEO Agent 做規劃,壹個 COO Agent 做路由,再有壹個研究員做長程任務,壹個個人助理采集屏幕和麥克風做上下文。說白了就是用多個開源 Agent 拼壹個個人級的 AI 操作系統。
Multi-Agent。這是最大的傘概念,上面所有的形態都屬於它。Cursor v3 內置最多 8 個並發 Agent,Google Antigravity 2.0 上線了 Agent Teams,GitHub Copilot 也跟進了 multi-agent workspace,amux 這種工具不可知的 orchestrator 用 tmux + SQLite 任務板 + git worktree 把多個不同廠的 Agent 編在壹起跑。
為什麼 2026 年上半年“多智能體架構”這件事突然集中爆發。我自己的判斷有叁條線索。

第壹條,模型上下文窗口不再是瓶頸,工程能力反倒成了瓶頸。1M token 已經是 Claude、Gemini 的標配,但你真把 1M 都塞滿,模型注意力切得稀碎。與其往壹個上下文裡硬塞,不如分裂成多個隔離上下文跑,每個幹淨、各自負責壹塊。這是 Sub-agent 流行的根本原因。
第贰條,Agentic 任務的真實形態就是分布式系統。Hermes Agent v0.13 那個 Kanban 多 Agent 看板我之前講過,心跳、重認領、僵屍檢測、retry,這些機制全是從分布式系統直接搬來的。Agent Team 也好、Dynamic Workflows 也罷,本質都是把模型當 worker,把 orchestration 當成壹個分布式調度問題。這個范式壹旦確立,多 Agent 協作就只是工程實現問題了。
第叁條,企業用戶真正進場。OpenAI 4 月 22 日發的 Workspace Agents、6 月 4 日上線的 ChatGPT Workspace Agents,全是沖著團隊協作來的,目標用戶從開發者擴到了銷售、市場、客服。這是從“session-based chat”到“fleet-based agent work”的范式遷移。組織裡需要的從來不是壹個萬能 ChatGPT,而是壹支各司其職、能持久跑的 Agent 編隊。
我自己體驗下來最大的體會:Sub-Agent 真好用,token 翻倍但任務質量明顯跳壹檔,特別是在長程研究和編程這類場景。Agent Team 就壹言難盡了,多個 Agent 互相通訊聽起來美,實際跑起來經常出現“兩個隊員都覺得對方應該先動”的死鎖。動態工作流真有效果,但成本是真高。
回頭看會覺得很有意思,2024 年我們說 Agent 是工具調用,2025 年說 Agent 是工作流,2026 年終於說到了“Agent 團隊”這個層級。壹個跑得好的 Agent 團隊,不再像壹個工具,更像壹個真正的部門。
伍、Coding Plan:AI 市場化路上的經典事件
2026 年上半年,影響開發者最大的壹次價格革命,是 Coding Plan。
這事的來龍去脈得從壹年前講起。Cursor、Claude Code這些 AI 編程工具,2024 年上線時幾乎統壹按 token 計費。壹個稍微復雜點的編程任務,跑壹次 Opus 幾拾美元起步,OpenClaw 這種 24 小時在線的 Agent 壹天燒出幾百塊也不稀奇。我自己裝 OpenClaw 那會兒,充 50 塊API進去,問到第叁個問題余額就負了。這是非常真實的體驗,不是段子。
按 token 付費,費用真的離譜。每壹次按回車前,你腦子裡都得過壹遍這個 prompt 大概要燒多少錢。開發者最討厭的事就是這種持續認知稅,寫代碼本來就累,再疊壹層成本焦慮,體驗直接勸退。
轉折點是 GLM 推出的 GLM Coding Plan。
定價結構很直接。20 元壹個月起,從 Lite 到 Max 200 元封頂。相比 Anthropic 自家 20 美元的 Pro 和 100 美元的 Max,定價差出壹個數量級。給的不是次數限制,是 5 小時滾動配額加上 7 天周配額。20 元這壹檔基本能撐住壹個全職程序員每天的 AI 編程量。
[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
Multi-Agent。這是最大的傘概念,上面所有的形態都屬於它。Cursor v3 內置最多 8 個並發 Agent,Google Antigravity 2.0 上線了 Agent Teams,GitHub Copilot 也跟進了 multi-agent workspace,amux 這種工具不可知的 orchestrator 用 tmux + SQLite 任務板 + git worktree 把多個不同廠的 Agent 編在壹起跑。
為什麼 2026 年上半年“多智能體架構”這件事突然集中爆發。我自己的判斷有叁條線索。

第壹條,模型上下文窗口不再是瓶頸,工程能力反倒成了瓶頸。1M token 已經是 Claude、Gemini 的標配,但你真把 1M 都塞滿,模型注意力切得稀碎。與其往壹個上下文裡硬塞,不如分裂成多個隔離上下文跑,每個幹淨、各自負責壹塊。這是 Sub-agent 流行的根本原因。
第贰條,Agentic 任務的真實形態就是分布式系統。Hermes Agent v0.13 那個 Kanban 多 Agent 看板我之前講過,心跳、重認領、僵屍檢測、retry,這些機制全是從分布式系統直接搬來的。Agent Team 也好、Dynamic Workflows 也罷,本質都是把模型當 worker,把 orchestration 當成壹個分布式調度問題。這個范式壹旦確立,多 Agent 協作就只是工程實現問題了。
第叁條,企業用戶真正進場。OpenAI 4 月 22 日發的 Workspace Agents、6 月 4 日上線的 ChatGPT Workspace Agents,全是沖著團隊協作來的,目標用戶從開發者擴到了銷售、市場、客服。這是從“session-based chat”到“fleet-based agent work”的范式遷移。組織裡需要的從來不是壹個萬能 ChatGPT,而是壹支各司其職、能持久跑的 Agent 編隊。
我自己體驗下來最大的體會:Sub-Agent 真好用,token 翻倍但任務質量明顯跳壹檔,特別是在長程研究和編程這類場景。Agent Team 就壹言難盡了,多個 Agent 互相通訊聽起來美,實際跑起來經常出現“兩個隊員都覺得對方應該先動”的死鎖。動態工作流真有效果,但成本是真高。
回頭看會覺得很有意思,2024 年我們說 Agent 是工具調用,2025 年說 Agent 是工作流,2026 年終於說到了“Agent 團隊”這個層級。壹個跑得好的 Agent 團隊,不再像壹個工具,更像壹個真正的部門。
伍、Coding Plan:AI 市場化路上的經典事件
2026 年上半年,影響開發者最大的壹次價格革命,是 Coding Plan。
這事的來龍去脈得從壹年前講起。Cursor、Claude Code這些 AI 編程工具,2024 年上線時幾乎統壹按 token 計費。壹個稍微復雜點的編程任務,跑壹次 Opus 幾拾美元起步,OpenClaw 這種 24 小時在線的 Agent 壹天燒出幾百塊也不稀奇。我自己裝 OpenClaw 那會兒,充 50 塊API進去,問到第叁個問題余額就負了。這是非常真實的體驗,不是段子。
按 token 付費,費用真的離譜。每壹次按回車前,你腦子裡都得過壹遍這個 prompt 大概要燒多少錢。開發者最討厭的事就是這種持續認知稅,寫代碼本來就累,再疊壹層成本焦慮,體驗直接勸退。
轉折點是 GLM 推出的 GLM Coding Plan。
定價結構很直接。20 元壹個月起,從 Lite 到 Max 200 元封頂。相比 Anthropic 自家 20 美元的 Pro 和 100 美元的 Max,定價差出壹個數量級。給的不是次數限制,是 5 小時滾動配額加上 7 天周配額。20 元這壹檔基本能撐住壹個全職程序員每天的 AI 編程量。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:
2026快過半:壹萬字,把這半年AI發生的事講明白