中國AI與美國的差距還在擴大,北大教授悲觀
前字節跳動工程師、北大教授張池指出,中美人工智能差距並未縮小,反而在擴大。國內大模型沉迷於“刷榜”拿高分,實際應用拉胯;訓練數據質量低、迭代周期是美國2-4倍、用戶付費意願弱形成負循環。那些美國名人“中國正在趕超”的論調,可能只是美國企業家的“煙霧彈”。
盡管外界普遍說我們在人工智能領域正在趕上美國,在有些領域可能已經領先。但壹位前字節跳動工程師認為,實際上差距正在進壹步擴大。
周末,北京大學助理教授、研究科學家兼助理教授張池(音譯)在《進入亞洲》播客節目中說:“我甚至不同意中國模型正在追趕的假設——我認為我們仍然遠遠落後。非常遺憾,我認為差距正在擴大”。
張池表示,他在字節跳動的人工智能部門工作了大約壹年,專注於人工智能模型,之後重返學術界。他表示,不否認人工智能的中國初創企業在快速發展,但由於美國的發展可能更快,我們必須認識到在我們快速發展的同時,實際上差異不僅沒有縮小,反而在持續擴大。這應該是正確認識我們的人工智能行業的重要的壹部分。
壹、中國大模型專注於如何提高基准測試的得分,但在實際應用中表現拉跨。
張池認為,雖然像字節跳動和阿裡巴巴這樣的大公司開放的大模型在基准測試中得分不錯,但這並不意味著它們在現實世界的應用中表現同樣出色。理論上,我們的每家大型科技公司都有好的大模型。但實際上它們還不夠好。因為許多大模型團隊專注於“benchmaxxing”——更注重考試成績而非實際表現的模型。如同於我們的壹些名頭響亮的高中,專注於培訓學生如何提高高考得分,成為考試機器,但很少注意如何提高學生的創造力。
字節跳動和阿裡巴巴推出了高知名度的AI模型——從像Seedance這樣的視頻生成器到像Qwen這樣的開源系統——但他們也因深度偽造、版權糾紛以及這些模型在現實中是否經得起考驗而遭遇了用戶端的廣泛質疑。
贰、中美大模型在基礎設施和訓練數據方面存在難以彌補的差距。
美國的大模型和中國大模型的基礎設施方面存在的巨大差距,是最公開的差距。這種差別不僅僅表現在我們無法獲取先進芯片,數據中心基礎設施薄弱,這些硬件的差距擺在桌面上,大家容易看到。更大地、大家看不到的差距是大模型訓練數據質量較低。我們的大模型無法獲得高質量的數據,訓練數據甚至被人為污染,這是中國大模型普遍存在結構性劣勢。

作者聲明:該圖片由AI生成
而且,訓練大模型的數據質量較低這壹劣勢難以逆轉。因為造成這壹劣勢的兩大原因是制度性的而非技術性的。比如我們對互聯網普遍存在的敏感單詞的審查導致的語言污染,比如我們的大模型應用產品和軟件壹樣難以獲得付費用戶,導致人工智能獲利模式轉向異端——如同互聯網時代的搜索引擎壹樣利用關鍵詞獲利,導致訓練數據甚至被人為污染。
邏輯上,在被污染的大模型數據面前,大模型的理論評分,有何意義?
很多人不理解我們的大多數大模型公司,為何熱衷於並依賴於從領先的美國模型中提取數據,而非建立自己的數據管道。公開的評論大都認為這是壹條捷徑,可以節省大模型投資。但大家忽略了其背後兩大問題:壹是依賴對美國大模型的蒸餾,壹些人工智能公司可能是迫不得已,因為他們非常清楚我們提供給大模型訓練的數據質量堪憂。贰是美國叁大大模型巨頭和白宮,都在出手遏制對其大模型的蒸餾,這必然將限制我們大模型的長期發展。
叁、我們的大模型更新迭代的周期是美國的2-4倍。

[物價飛漲的時候 這樣省錢購物很爽]
還沒人說話啊,我想來說幾句
盡管外界普遍說我們在人工智能領域正在趕上美國,在有些領域可能已經領先。但壹位前字節跳動工程師認為,實際上差距正在進壹步擴大。
周末,北京大學助理教授、研究科學家兼助理教授張池(音譯)在《進入亞洲》播客節目中說:“我甚至不同意中國模型正在追趕的假設——我認為我們仍然遠遠落後。非常遺憾,我認為差距正在擴大”。
張池表示,他在字節跳動的人工智能部門工作了大約壹年,專注於人工智能模型,之後重返學術界。他表示,不否認人工智能的中國初創企業在快速發展,但由於美國的發展可能更快,我們必須認識到在我們快速發展的同時,實際上差異不僅沒有縮小,反而在持續擴大。這應該是正確認識我們的人工智能行業的重要的壹部分。
壹、中國大模型專注於如何提高基准測試的得分,但在實際應用中表現拉跨。
張池認為,雖然像字節跳動和阿裡巴巴這樣的大公司開放的大模型在基准測試中得分不錯,但這並不意味著它們在現實世界的應用中表現同樣出色。理論上,我們的每家大型科技公司都有好的大模型。但實際上它們還不夠好。因為許多大模型團隊專注於“benchmaxxing”——更注重考試成績而非實際表現的模型。如同於我們的壹些名頭響亮的高中,專注於培訓學生如何提高高考得分,成為考試機器,但很少注意如何提高學生的創造力。
字節跳動和阿裡巴巴推出了高知名度的AI模型——從像Seedance這樣的視頻生成器到像Qwen這樣的開源系統——但他們也因深度偽造、版權糾紛以及這些模型在現實中是否經得起考驗而遭遇了用戶端的廣泛質疑。
贰、中美大模型在基礎設施和訓練數據方面存在難以彌補的差距。
美國的大模型和中國大模型的基礎設施方面存在的巨大差距,是最公開的差距。這種差別不僅僅表現在我們無法獲取先進芯片,數據中心基礎設施薄弱,這些硬件的差距擺在桌面上,大家容易看到。更大地、大家看不到的差距是大模型訓練數據質量較低。我們的大模型無法獲得高質量的數據,訓練數據甚至被人為污染,這是中國大模型普遍存在結構性劣勢。

作者聲明:該圖片由AI生成
而且,訓練大模型的數據質量較低這壹劣勢難以逆轉。因為造成這壹劣勢的兩大原因是制度性的而非技術性的。比如我們對互聯網普遍存在的敏感單詞的審查導致的語言污染,比如我們的大模型應用產品和軟件壹樣難以獲得付費用戶,導致人工智能獲利模式轉向異端——如同互聯網時代的搜索引擎壹樣利用關鍵詞獲利,導致訓練數據甚至被人為污染。
邏輯上,在被污染的大模型數據面前,大模型的理論評分,有何意義?
很多人不理解我們的大多數大模型公司,為何熱衷於並依賴於從領先的美國模型中提取數據,而非建立自己的數據管道。公開的評論大都認為這是壹條捷徑,可以節省大模型投資。但大家忽略了其背後兩大問題:壹是依賴對美國大模型的蒸餾,壹些人工智能公司可能是迫不得已,因為他們非常清楚我們提供給大模型訓練的數據質量堪憂。贰是美國叁大大模型巨頭和白宮,都在出手遏制對其大模型的蒸餾,這必然將限制我們大模型的長期發展。
叁、我們的大模型更新迭代的周期是美國的2-4倍。

[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:



