Karpathy 說,編程已經面目全非了
剛剛 Andrej Karpathy 在 X 上發了壹條長帖,聊了聊他最近對 AI 編程的感受。Karpathy 是誰就不用多介紹了,前 OpenAI 研究副總裁,前特斯拉 AI 總監,在整個 AI 圈子裡說話是有分量的。這條帖子發出來之後迅速引爆了討論,評論區裡各路大佬紛紛下場,有贊同的,有補充的,也有潑冷水的。我把整條帖子和評論區的精華都看了壹遍,覺得裡面有不少值得琢磨的東西,整理出來跟大家聊聊。
變化是突然發生的
Karpathy 開篇就說了壹句很重的話:過去兩個月,編程因為 AI 發生了巨大的變化。注意,他強調的是這個變化不是那種漸進式的、潤物細無聲的進步,而是集中在去年 12 月突然爆發的。在他看來,12 月之前,編程 Agent 基本上不好用;12 月之後,基本上好用了。模型的質量、長期連貫性和韌性都有了顯著提升,可以壹口氣啃下又大又長的任務。
這個判斷其實挺值得玩味的。我們平時總覺得技術進步是壹條平滑的曲線,今天比昨天好壹點,明天比今天好壹點。但 Karpathy 的感受是,有些變化是台階式的,某個臨界點壹過,體驗就完全不同了。這種感覺其實很多人在日常生活中也遇到過,比如學壹門技能,練了很久沒什麼進展,突然有壹天就開竅了。技術的演進有時候也是這樣,量變積累到壹定程度,質變就來了。壹個周末項目變成了 30 分鍾的事
為了說明變化有多大,Karpathy 舉了壹個自己的親身例子。他周末想給家裡的攝像頭搭壹個本地視頻分析面板,於是給 AI Agent 寫了壹段指令:登錄我的 DGX Spark,配置 SSH 密鑰,部署 vLLM,下載並測試 Qwen3-VL 模型,搭建視頻推理服務端點,做壹個基礎的 Web UI 面板,全部測試壹遍,用 systemd 設置開機自啟,給自己記筆記,最後給我寫壹份 Markdown 報告。
然後 Agent 就跑了大概 30 分鍾。中間遇到了好幾個問題,它自己上網查解決方案,壹個壹個解決,寫代碼,測試,調試,配置服務,最後交回來壹份報告,全部搞定。Karpathy 說他全程沒有碰任何東西。這件事如果放在叁個月前,輕輕松松就是壹個周末項目,現在變成了你啟動壹下然後去幹別的,30 分鍾後回來收結果。
這個例子的沖擊力在於它的具體。不是什麼抽象的概念,就是壹個實實在在的工程任務,從網絡配置到模型部署到前端界面到系統服務,全鏈路打通。叁個月前需要壹個周末,現在 30 分鍾。這個效率的躍遷已經不是提升百分之多少的問題了,是數量級的變化。

編程正在變得面目全非
基於這樣的體驗,Karpathy 做了壹個很大膽的判斷:編程正在變得面目全非。從計算機發明以來,編程壹直是人坐在編輯器前面敲代碼,這個時代結束了。現在你做的事情是啟動 AI Agent,用英語給它們分配任務,然後並行地管理和審查它們的工作。
他說,當前最大的機會在於不斷向上攀升抽象層級,搭建長期運行的編排系統,給它配好工具、記憶和指令,讓它幫你管理多個並行的代碼實例。頂級的 Agent 工程所能釋放的杠杆效應,現在感覺非常高。
這段話裡有壹個關鍵詞叫抽象層級。簡單來說就是,以前你是直接寫代碼的人,現在你是管理寫代碼的 Agent 的人,未來你可能是管理那些管理 Agent 的系統的人。每往上走壹層,你能撬動的產出就成倍增長。這個邏輯其實跟管理學裡的道理是相通的,壹個人能直接做的事情是有限的,但如果你能搭建壹個高效的團隊和流程,你的產出上限就被打開了。它並不完美,但已經夠顛覆了
Karpathy 也沒有壹味地吹。他很坦誠地說,這個東西並不完美,它需要高層次的方向指引、判斷力、品味、監督、迭代,以及提示和想法。在某些場景下效果好很多,尤其是那些需求明確、可以驗證和測試功能的任務。關鍵在於培養壹種直覺,知道怎麼把任務拆解得恰到好處,把適合交給 Agent 的部分交出去,自己在邊緣地帶幫忙補位。
[加西網正招聘多名全職sales 待遇優]
好新聞沒人評論怎麼行,我來說幾句
變化是突然發生的
Karpathy 開篇就說了壹句很重的話:過去兩個月,編程因為 AI 發生了巨大的變化。注意,他強調的是這個變化不是那種漸進式的、潤物細無聲的進步,而是集中在去年 12 月突然爆發的。在他看來,12 月之前,編程 Agent 基本上不好用;12 月之後,基本上好用了。模型的質量、長期連貫性和韌性都有了顯著提升,可以壹口氣啃下又大又長的任務。
這個判斷其實挺值得玩味的。我們平時總覺得技術進步是壹條平滑的曲線,今天比昨天好壹點,明天比今天好壹點。但 Karpathy 的感受是,有些變化是台階式的,某個臨界點壹過,體驗就完全不同了。這種感覺其實很多人在日常生活中也遇到過,比如學壹門技能,練了很久沒什麼進展,突然有壹天就開竅了。技術的演進有時候也是這樣,量變積累到壹定程度,質變就來了。壹個周末項目變成了 30 分鍾的事
為了說明變化有多大,Karpathy 舉了壹個自己的親身例子。他周末想給家裡的攝像頭搭壹個本地視頻分析面板,於是給 AI Agent 寫了壹段指令:登錄我的 DGX Spark,配置 SSH 密鑰,部署 vLLM,下載並測試 Qwen3-VL 模型,搭建視頻推理服務端點,做壹個基礎的 Web UI 面板,全部測試壹遍,用 systemd 設置開機自啟,給自己記筆記,最後給我寫壹份 Markdown 報告。
然後 Agent 就跑了大概 30 分鍾。中間遇到了好幾個問題,它自己上網查解決方案,壹個壹個解決,寫代碼,測試,調試,配置服務,最後交回來壹份報告,全部搞定。Karpathy 說他全程沒有碰任何東西。這件事如果放在叁個月前,輕輕松松就是壹個周末項目,現在變成了你啟動壹下然後去幹別的,30 分鍾後回來收結果。
這個例子的沖擊力在於它的具體。不是什麼抽象的概念,就是壹個實實在在的工程任務,從網絡配置到模型部署到前端界面到系統服務,全鏈路打通。叁個月前需要壹個周末,現在 30 分鍾。這個效率的躍遷已經不是提升百分之多少的問題了,是數量級的變化。

編程正在變得面目全非
基於這樣的體驗,Karpathy 做了壹個很大膽的判斷:編程正在變得面目全非。從計算機發明以來,編程壹直是人坐在編輯器前面敲代碼,這個時代結束了。現在你做的事情是啟動 AI Agent,用英語給它們分配任務,然後並行地管理和審查它們的工作。
他說,當前最大的機會在於不斷向上攀升抽象層級,搭建長期運行的編排系統,給它配好工具、記憶和指令,讓它幫你管理多個並行的代碼實例。頂級的 Agent 工程所能釋放的杠杆效應,現在感覺非常高。
這段話裡有壹個關鍵詞叫抽象層級。簡單來說就是,以前你是直接寫代碼的人,現在你是管理寫代碼的 Agent 的人,未來你可能是管理那些管理 Agent 的系統的人。每往上走壹層,你能撬動的產出就成倍增長。這個邏輯其實跟管理學裡的道理是相通的,壹個人能直接做的事情是有限的,但如果你能搭建壹個高效的團隊和流程,你的產出上限就被打開了。它並不完美,但已經夠顛覆了
Karpathy 也沒有壹味地吹。他很坦誠地說,這個東西並不完美,它需要高層次的方向指引、判斷力、品味、監督、迭代,以及提示和想法。在某些場景下效果好很多,尤其是那些需求明確、可以驗證和測試功能的任務。關鍵在於培養壹種直覺,知道怎麼把任務拆解得恰到好處,把適合交給 Agent 的部分交出去,自己在邊緣地帶幫忙補位。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:



