DeepSeek公布成本收入和利润率!最高日赚346万

2025-03-01 | 来源: 极客公园 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

Decode Load Balancer的关键问题是，不同数据并行（DP）实例上的请求数量、长度不同，导致core-attention计算量（与KVCache占用量相关）、dispatch发送量不同。

其优化目标是，各GPU的KVCache占用量尽量相同（core-attention计算负载均衡）、请求数量尽量相同（dispatch发送量负载均衡）。

专家并行负载均衡器的核心问题：对于给定MoE模型，存在一些天然的高负载专家（expert），导致不同GPU的专家计算负载不均衡。

其优化目标是，每个GPU上的专家计算量均衡（即最小化所有GPU的dispatch接收量的最大值）。

▲DeepSeek在线推理系统图

[加西网正招聘多名全职sales 待遇优] 还没人说话啊，我想来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

DeepSeek公布成本收入和利润率!最高日赚346万

意见