2026快過半:壹萬字,把這半年AI發生的事講明白

2026-06-12 | 來源: 沃垠AI | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

大家好，我是冷逸。

昨天晚上做飯的時候，我用手機命令電腦裡的 AI 幹了叁件事：打開壹堆 PDF 發票整理成 Excel 報銷單、壹句話給電影《火遮眼》做壹個帶宣傳視頻+海報的網站，以及按我的風格給這篇稿子寫個開頭。

飯做完，活兒幹完了。

這種事，壹年前是科幻，今年是日常。

我說這個不是要煽情。我是想說，2026 上半年的 AI，已經不是“哪個模型分高”那回事了。模型這壹頭的卷，到 GPT-5.5、Claude 4.8、M3 這壹檔，邊際收益肉眼可見地在遞減。真正發生變化的地方，悄悄挪到了別處——挪到了你怎麼把 AI 裝進自己生活、裝進自己工作流以及裝進自己的電腦裡。

這半年我壹線測過的產品多到說不清，發布會看到壹半就關掉的也多到數不清。這篇文章不是流水賬，是我從壹堆事裡挑了 10 件，自己親手用過、踩過坑、形成判斷的，串成壹條線。

10 個話題的順序是：Agent Skills、OpenClaw、Harness、Multi-Agent（包括Agent OS、Sub-agent）、Coding Plan、CLI回歸、Desktop Agent、Physical AI、語音交互、Seedance 2.0。

壹萬字，慢慢看。

壹、Agent Skills：2026 年最值得學的技能

整個上半年，最被低估、又最影響壹線工作流的事，是 Agent Skills。

它在半年裡完成了從壹家廠的功能，到行業標准的跨越。Anthropic 去年 10 月推出，12 月做成開放標准，到現在OpenAI、谷歌以及國內 AI 廠商全跟上。

那它到底是什麼。壹句話理解，Skills 是壹個文件夾，裡面必須有壹份 SKILL.md，開頭是 YAML 元數據 name 和 description，下面是 Markdown 寫的執行說明，再帶上可選的 scripts 子目錄、references 子目錄和 assets 資源文件。

Agent Skills 最有意思的是progressive disclosure 這個漸進式披露機制。叁層結構。第壹層是元數據，每個 Skill 大約 50 到 100 個 token，會話啟動時全部 Skills 的 name 和 description 都進系統提示詞，模型只是“知道有這些 Skill 存在”。第贰層是指令，整份 SKILL.md 的正文，官方建議控制在 5000 token 以內、500 行以內，只在模型判斷當前任務匹配某個 Skill 時才加載進上下文。第叁層是資源，scripts 和 references 這些更深的文件，只在 SKILL.md 主動 reference 到它們時才進上下文。

這套架構在解決壹個非常實在的問題，上下文的稀缺性。早期 Agent 的痛點是塞東西，誰都想往 System Prompt 裡塞更多專業知識，但塞越多模型越糊。Skills 把“有哪些能力”和“具體怎麼幹”在物理上拆開了，讓模型只為正在做的事付 token。

[物價飛漲的時候這樣省錢購物很爽] 還沒人說話啊，我想來說幾句

分享:

上壹頁12 3 4 ...9 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

2026快過半:壹萬字,把這半年AI發生的事講明白

意見