Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_6ed1b4eb7b8a3fff1539bc84b4813ef7, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
DeepSeek"日赚"56万,"朋友圈"掀起算力战 | 温哥华教育中心
   

DeepSeek"日赚"56万,"朋友圈"掀起算力战

一位不愿透露姓名的服务器专家向「硅基研究室」表示,国产AI芯片现阶段仍需要基于大模型做专门设计,例如“低精度高缓存”,加快支持FP8数据类型(DeepSeek采用了 FP8混合精度训练),让推理更加便宜的同时,也利于下游服务器厂商的设计。


在云厂商及算力服务商侧,在豪赌之外,需要算大模型的经济账——除了采购芯片外,数据中心建设还包括了能源配套、人力配套(运维、研发)和数据资产等成本支出。

除此以外,在大模型抵达最终训练前,前期研究、所使用的数据训练等各环节的试错成本,以及人员薪酬等这些也都是总成本的一部分,模型厂商并不会公开这些隐形成本。

因此,如何在算力建设的每一环降低资源浪费,这既考验大厂各家的Infra能力,也考验自身的预期管理。

海外云厂商的普遍做法有延长服务器折旧周期,与能源公司合作等手段,有的也及时止损。此前微软就被曝出暂停了OpenAI计划使用的威斯康星州人工智能数据中心的部分建设,原因是高估了部分地区的算力需求。

一边更合理地规划资源,提升算力利用率。另一边,巧妙施展财技,保证利润率水平,这也是后续云厂商反应在基本面上的趋势。具体到模型侧,拥抱开源、持续优化算法,已经成为了当前各大厂商的阶段共识。


与此同时,在应用侧推动产品爆发、落地,也成为了厂商们拓展“算力故事”的重点。根据「硅基研究室」多方了解,C端的个人Agent、B端的企业私有化部署以及G端的政务公共智算云,则是行业目前关注的三大方向。

如果说,过去OpenAI掀起的是一场算力游戏,那么DeepSeek出圈后,这场游戏还将继续,只不过它有了新的定语,这是一场“算力效率”的游戏。

尽管一度被砸掉6000亿美金市值,黄仁勋还是多次对DeepSeek给予了正面评价,最新的财报电话会议中,他说:“感谢DeepSeek,它开源了一个绝对世界级的推理模型。”

[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
上一页123456下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站