Token=词元 Prompt=文令…这些AI术语的中文名定了




本文来自微信公众号: APPSO ,作者:正在发出文令的

2012年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。

这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道“字节”说的是某种文字层面的基本单位。

干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。

现在,“字节跳动”成了全球价值最高的独角兽公司。但要是问你:如果当年那家公司叫“存储单位跳动”,你还觉得那么自然吗?

别笑,这就是最近AI行业在发生的事。

别吵了,Token最好的中文翻译一直在那儿

上周大家对于Token该翻译成生什么吵翻天“模元”“智元”“灵符”“令牌”“偷啃”……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。

这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题——Token在技术上到底是什么?

它不是“智能”的单位,不是“模型”的单位,它是语言处理的最小单位。

“灵符”有东方赛博美感,但术语不需要意境,它需要精确。

“智元”大气,但Token是语言的处理单位,不是“智能”的单位,往上贴“智”字是贴错了标签。

“令牌”最离谱,这是Token在计算机安全领域的既有译法,特指身份验证凭证,拿来混用等于把银行卡和扑克牌叫同一个名字。

“偷啃”这种音译就完全丧失了中文的优势了。


其实在这场混战之前,答案早就在那里了。

在自然语言处理(NLP)学术文献里,Token作为文本的最小处理单位,长期被译为“词元”。

词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。

苹果就采用了这个译法。打开Apple中国官网,产品详情页写着“词元响应速度”。



要知道苹果的中文本地化团队是出了名的较真——AirDrop叫“隔空投送”,Live Text叫“实况文本”,每个词都是反复推敲的结果,目标只有一个:准确、简洁、有造词美感。

苹果选了“词元”,绝不是心血来潮。无独有偶,在央视新闻节目里,Token同样被译作词元。

[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    直击GTC,老黄就指着你烧token了 Token太贵了,还是用人吧,人耐造,还便宜
    10万token GPT4最强对手1分秒杀  
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站