Token=词元 Prompt=文令…这些AI术语的中文名定了

本文来自微信公众号: APPSO ,作者:正在发出文令的
2012年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。
这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道“字节”说的是某种文字层面的基本单位。
干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。
现在,“字节跳动”成了全球价值最高的独角兽公司。但要是问你:如果当年那家公司叫“存储单位跳动”,你还觉得那么自然吗?
别笑,这就是最近AI行业在发生的事。
别吵了,Token最好的中文翻译一直在那儿
上周大家对于Token该翻译成生什么吵翻天“模元”“智元”“灵符”“令牌”“偷啃”……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。
这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题——Token在技术上到底是什么?
它不是“智能”的单位,不是“模型”的单位,它是语言处理的最小单位。
“灵符”有东方赛博美感,但术语不需要意境,它需要精确。
“智元”大气,但Token是语言的处理单位,不是“智能”的单位,往上贴“智”字是贴错了标签。
“令牌”最离谱,这是Token在计算机安全领域的既有译法,特指身份验证凭证,拿来混用等于把银行卡和扑克牌叫同一个名字。
“偷啃”这种音译就完全丧失了中文的优势了。
其实在这场混战之前,答案早就在那里了。
在自然语言处理(NLP)学术文献里,Token作为文本的最小处理单位,长期被译为“词元”。
词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。
苹果就采用了这个译法。打开Apple中国官网,产品详情页写着“词元响应速度”。

要知道苹果的中文本地化团队是出了名的较真——AirDrop叫“隔空投送”,Live Text叫“实况文本”,每个词都是反复推敲的结果,目标只有一个:准确、简洁、有造词美感。
苹果选了“词元”,绝不是心血来潮。无独有偶,在央视新闻节目里,Token同样被译作词元。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
直击GTC,老黄就指着你烧token了 |
Token太贵了,还是用人吧,人耐造,还便宜 |
10万token GPT4最强对手1分秒杀 |
推荐:
Token=词元 Prompt=文令…这些AI术语的中文名定了