DeepSeek"日赚"56万,"朋友圈"掀起算力战

2025-03-04 | 来源: 硅基研究室 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

一位不愿透露姓名的服务器专家向「硅基研究室」表示，国产AI芯片现阶段仍需要基于大模型做专门设计，例如“低精度高缓存”，加快支持FP8数据类型（DeepSeek采用了 FP8混合精度训练），让推理更加便宜的同时，也利于下游服务器厂商的设计。

在云厂商及算力服务商侧，在豪赌之外，需要算大模型的经济账——除了采购芯片外，数据中心建设还包括了能源配套、人力配套（运维、研发）和数据资产等成本支出。

除此以外，在大模型抵达最终训练前，前期研究、所使用的数据训练等各环节的试错成本，以及人员薪酬等这些也都是总成本的一部分，模型厂商并不会公开这些隐形成本。

因此，如何在算力建设的每一环降低资源浪费，这既考验大厂各家的Infra能力，也考验自身的预期管理。

海外云厂商的普遍做法有延长服务器折旧周期，与能源公司合作等手段，有的也及时止损。此前微软就被曝出暂停了OpenAI计划使用的威斯康星州人工智能数据中心的部分建设，原因是高估了部分地区的算力需求。

一边更合理地规划资源，提升算力利用率。另一边，巧妙施展财技，保证利润率水平，这也是后续云厂商反应在基本面上的趋势。具体到模型侧，拥抱开源、持续优化算法，已经成为了当前各大厂商的阶段共识。

与此同时，在应用侧推动产品爆发、落地，也成为了厂商们拓展“算力故事”的重点。根据「硅基研究室」多方了解，C端的个人Agent、B端的企业私有化部署以及G端的政务公共智算云，则是行业目前关注的三大方向。

如果说，过去OpenAI掀起的是一场算力游戏，那么DeepSeek出圈后，这场游戏还将继续，只不过它有了新的定语，这是一场“算力效率”的游戏。

尽管一度被砸掉6000亿美金市值，黄仁勋还是多次对DeepSeek给予了正面评价，最新的财报电话会议中，他说：“感谢DeepSeek，它开源了一个绝对世界级的推理模型。”

[物价飞涨的时候这样省钱购物很爽] 这条新闻还没有人评论喔，等着您的高见呢

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

DeepSeek"日赚"56万,"朋友圈"掀起算力战

意见