中國的大模型成本僅國外叁拾分之壹,硅谷恐慌

[加州] 中國的大模型成本僅國外叁拾分之壹,硅谷恐慌

2025-01-25 | 來源: 知識分子 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

“從核心原理上來講，DeepSeek的大部分訓練技巧在AI發展過程中都有跡可循，但其所揭示的直接強化學習的巨大潛力，以及訓練過程中自反思和探索行為的湧現，對大模型高效訓練乃至人類學習模式的探索都有很大啟發意義。”相關研究人員表示。

03 這個大模型能為中國的AI行業帶來什麼？

對於DeepSeek，《自然》雜志指出：盡管美國出口管制限制中國公司獲得為人工智能處理而設計的最佳計算機芯片，但它還是成功制造了（DeepSeek的） R1。

在硅谷，人們將這個節省算力的中國大模型稱作“來自東方的神秘力量”，從《紐約時報》到《連線》、《福布斯》幾乎所有的媒體都在說：美國對先進半導體的出口管制旨在減緩中國人工智能的發展，但這可能無意中刺激了創新。”

那麼，這樣壹個節省算力的大模型會成為中國針對AI芯片禁運的解法嗎？

壹位人工智能領域的專家告訴《知識分子》：最終，“還是需要把芯片搞上去。”

算力困境仍在，然而，這樣壹個極度節省算力的大模型的出現仍然給中國的大模型們帶來了新的希望——除了算力，我們可以依靠的還有優化。正如《自然》雜志上引用的華盛頓西雅圖的人工智能研究員 François Chollet 的評價：“這壹事實表明，高效利用資源比單純的計算規模更重要。”

《福布斯》則指出，它讓世界認識到，“中國並未退出這場（人工智能的）競賽。”

這個來自中國的大模型讓人們看到了從構架、算法上進行優化的潛力，幾乎是以壹己之力扭轉了全球大模型領域對算力的瘋狂追逐，為無數的小公司帶來了新的機會。

《自然》雜志說，DeepSeek的V3訓練時只花了不到600萬美元，而Meta訓練其最新人工智能模型Llama 3.1 405B時所耗資金超過6000萬，《紐約時報》說：“有600萬美元資金的公司在數量上遠遠多於有1億美元或10億美元資金的公司”。

效率之外，DeepSeek另壹個常被誇贊的亮點是開源。Reddit上，人們贊歎DeepSeek“開源、而且可以本地運行”，“我壹定要下載壹個到我的電腦上”。

開源，這意味著這個模型的研發者將不僅只與自己的同事合作，他們“其實在與世界各地最優秀的同行合作”，《紐約時報》說，“如果最好的開源技術來自中國，美國開發人員將在這些技術的基礎上構建他們的系統。從長遠來看，這可能會讓中國成為研發人工智能的中心。”

當然，引領整個生態，那是遙遠的未來，開源，更為直接的，肉眼可見的壹個影響是：“壹個開源又好用的AI，它會迅速占領學術界的”，前述人工智能相關專家告訴《知識分子》。

[加西網正招聘多名全職sales 待遇優] 還沒人說話啊，我想來說幾句

分享:

上壹頁 1 23下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

[加州] 中國的大模型成本僅國外叁拾分之壹,硅谷恐慌

意見