把Token价格打下来,中国芯片公司换了种活法

这是虎嗅WAIC“追踪Token商业新范式”系列文章第05期。
2026年,红果短剧平台上出了个新物种:三五个人的小团队,靠 AI 工具批量造短剧。产量翻倍、成本骤降。
这件事当然有着某种颠覆的意味,一个叫做OPC(一人公司)的组织形式率先在短剧行业诞生。但在上海浦东的曦望Sunrise(日出)办公室,联席CEO王湛看到的,是一个叫做“Token 消耗量”的数字。
Token,简单说,就是 AI 干活的计量单位。你让 AI 写一段话、画一张图、生成一集短剧,它都在消耗 Token。Token 越多,烧的算力越多,花的钱也越多。曦望科技(以下简称:曦望)卖的东西,恰好就是让这笔账变便宜的芯片。
“我们预判了推理算力会大幅度增长,但没料到增速如此之快。”王湛说。

曦望联席CEO王湛 图片由曦望科技提供
如果要找一家公司来讲 Token 的故事,曦望大概是最合适的那个。Token 是推理需求爆发之后才火的概念,而曦望做的,恰好就是Token工厂里最核心的推理 GPU。
一同参与此次话题讨论的,还有曦望科技的CTO高洋。和王湛相比,高洋是一个纯粹的技术人,甚至有些“社恐”,他是一个文字表达逻辑大于话语表达的人。王湛则不一样,他更像是一个企业家,具备商业嗅觉,对市场变化反应极快。

曦望CTO高洋 图片由曦望科技提供
王湛说,这也是曦望团队的特点,集群作战,各有所长。
从会议室的落地窗望出去,黄浦江缓缓流过。对岸是徐汇西岸的东西双塔,中国 AI 公司密度最高的地方。几站地铁外是张江,芯片企业密密匝匝。曦望卡在这两个产业的交汇点。
它从一家 AI 公司——商汤科技孵化而来,基因里天然带着“软件优先”的直觉:先看大模型和AI软件往哪走,再据此定义硬件,让硬件设计服从软件的走向。这种视角,让曦望从诞生的第一天起就盯上了推理市场。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
把Token价格打下来,中国芯片公司换了种活法