把Token價格打下來,中國芯片公司換了種活法

這是虎嗅WAIC“追蹤Token商業新范式”系列文章第05期。
2026年,紅果短劇平台上出了個新物種:叁伍個人的小團隊,靠 AI 工具批量造短劇。產量翻倍、成本驟降。
這件事當然有著某種顛覆的意味,壹個叫做OPC(壹人公司)的組織形式率先在短劇行業誕生。但在上海浦東的曦望Sunrise(日出)辦公室,聯席CEO王湛看到的,是壹個叫做“Token 消耗量”的數字。
Token,簡單說,就是 AI 幹活的計量單位。你讓 AI 寫壹段話、畫壹張圖、生成壹集短劇,它都在消耗 Token。Token 越多,燒的算力越多,花的錢也越多。曦望科技(以下簡稱:曦望)賣的東西,恰好就是讓這筆賬變便宜的芯片。
“我們預判了推理算力會大幅度增長,但沒料到增速如此之快。”王湛說。

曦望聯席CEO王湛 圖片由曦望科技提供
如果要找壹家公司來講 Token 的故事,曦望大概是最合適的那個。Token 是推理需求爆發之後才火的概念,而曦望做的,恰好就是Token工廠裡最核心的推理 GPU。
壹同參與此次話題討論的,還有曦望科技的CTO高洋。和王湛相比,高洋是壹個純粹的技術人,甚至有些“社恐”,他是壹個文字表達邏輯大於話語表達的人。王湛則不壹樣,他更像是壹個企業家,具備商業嗅覺,對市場變化反應極快。

曦望CTO高洋 圖片由曦望科技提供
王湛說,這也是曦望團隊的特點,集群作戰,各有所長。
從會議室的落地窗望出去,黃浦江緩緩流過。對岸是徐匯西岸的東西雙塔,中國 AI 公司密度最高的地方。幾站地鐵外是張江,芯片企業密密匝匝。曦望卡在這兩個產業的交匯點。
它從壹家 AI 公司——商湯科技孵化而來,基因裡天然帶著“軟件優先”的直覺:先看大模型和AI軟件往哪走,再據此定義硬件,讓硬件設計服從軟件的走向。這種視角,讓曦望從誕生的第壹天起就盯上了推理市場。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:
把Token價格打下來,中國芯片公司換了種活法