DeepSeek"日赚"56万,"朋友圈"掀起算力战
一位不愿透露姓名的服务器专家向「硅基研究室」表示,国产AI芯片现阶段仍需要基于大模型做专门设计,例如“低精度高缓存”,加快支持FP8数据类型(DeepSeek采用了 FP8混合精度训练),让推理更加便宜的同时,也利于下游服务器厂商的设计。
在云厂商及算力服务商侧,在豪赌之外,需要算大模型的经济账——除了采购芯片外,数据中心建设还包括了能源配套、人力配套(运维、研发)和数据资产等成本支出。
除此以外,在大模型抵达最终训练前,前期研究、所使用的数据训练等各环节的试错成本,以及人员薪酬等这些也都是总成本的一部分,模型厂商并不会公开这些隐形成本。
因此,如何在算力建设的每一环降低资源浪费,这既考验大厂各家的Infra能力,也考验自身的预期管理。
海外云厂商的普遍做法有延长服务器折旧周期,与能源公司合作等手段,有的也及时止损。此前微软就被曝出暂停了OpenAI计划使用的威斯康星州人工智能数据中心的部分建设,原因是高估了部分地区的算力需求。
一边更合理地规划资源,提升算力利用率。另一边,巧妙施展财技,保证利润率水平,这也是后续云厂商反应在基本面上的趋势。具体到模型侧,拥抱开源、持续优化算法,已经成为了当前各大厂商的阶段共识。
与此同时,在应用侧推动产品爆发、落地,也成为了厂商们拓展“算力故事”的重点。根据「硅基研究室」多方了解,C端的个人Agent、B端的企业私有化部署以及G端的政务公共智算云,则是行业目前关注的三大方向。
如果说,过去OpenAI掀起的是一场算力游戏,那么DeepSeek出圈后,这场游戏还将继续,只不过它有了新的定语,这是一场“算力效率”的游戏。
尽管一度被砸掉6000亿美金市值,黄仁勋还是多次对DeepSeek给予了正面评价,最新的财报电话会议中,他说:“感谢DeepSeek,它开源了一个绝对世界级的推理模型。”
[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
在云厂商及算力服务商侧,在豪赌之外,需要算大模型的经济账——除了采购芯片外,数据中心建设还包括了能源配套、人力配套(运维、研发)和数据资产等成本支出。
除此以外,在大模型抵达最终训练前,前期研究、所使用的数据训练等各环节的试错成本,以及人员薪酬等这些也都是总成本的一部分,模型厂商并不会公开这些隐形成本。
因此,如何在算力建设的每一环降低资源浪费,这既考验大厂各家的Infra能力,也考验自身的预期管理。
海外云厂商的普遍做法有延长服务器折旧周期,与能源公司合作等手段,有的也及时止损。此前微软就被曝出暂停了OpenAI计划使用的威斯康星州人工智能数据中心的部分建设,原因是高估了部分地区的算力需求。
一边更合理地规划资源,提升算力利用率。另一边,巧妙施展财技,保证利润率水平,这也是后续云厂商反应在基本面上的趋势。具体到模型侧,拥抱开源、持续优化算法,已经成为了当前各大厂商的阶段共识。
与此同时,在应用侧推动产品爆发、落地,也成为了厂商们拓展“算力故事”的重点。根据「硅基研究室」多方了解,C端的个人Agent、B端的企业私有化部署以及G端的政务公共智算云,则是行业目前关注的三大方向。
如果说,过去OpenAI掀起的是一场算力游戏,那么DeepSeek出圈后,这场游戏还将继续,只不过它有了新的定语,这是一场“算力效率”的游戏。
尽管一度被砸掉6000亿美金市值,黄仁勋还是多次对DeepSeek给予了正面评价,最新的财报电话会议中,他说:“感谢DeepSeek,它开源了一个绝对世界级的推理模型。”
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
DeepSeek"日赚"56万,"朋友圈"掀起算力战