把国产剧卖到非洲,80后小伙冲进福布斯榜
宋克的想法是,既然用户的需求已经被解决了,那么趣丸能做的,是找到新的技术再“反攻”。这表明,趣丸针对的还是“老的”互联网市场,只是在探索过程中,发现一些需求只能由AI来满足,或者AI能够更好地满足。
2021年,OpenAI的GPT-3已经震惊AI圈内,但大模型还不是一门显学。趣丸一开始的探索,也不是冲着AI去的。

OpenAI的GPT-4o模型评估
“大事都是从一个很小的点开始。”宋克说。趣丸拿住了语音赛道,但短视频明显正在升温,宋克想到,很多声音好听的人,不一定希望以真人形象出镜,“我们当时想到直播时,把主播的脸换成动漫脸这样的技术”。2021年、2022年,“换脸”还不像今天这样普遍。
但是技术攻克下来,产品上线以后,用户不买账。用户会觉得,换脸的主播一定不好看,不然为什么换脸呢?于是,这项技术就被搁置起来。
2023年,元宇宙爆火,让宋克灵光一闪。元宇宙打造的“数字孪生”,把真人数字化,实质也是换脸,只不过是把真人脸换成同一张数字人脸。“我们储备好了这项能力,甚至所有工程都不用再开发。”宋克说,于是趣丸快速切入,成为美团数字人直播的第一家技术提供商。
入局以后,关于声音的技术问题自然浮出。
数字人直播早期,可选音色少,语音复制也很粗糙,更关键的是,虚拟的声音“机器味”太重,“说话没有人味”,观众自然不爱看。

数字人直播早期并不受欢迎
此时,大模型已凭借对自然语言的理解能力大为火热,宋克想到,越过“恐怖谷”的最好办法,可能是将大模型对文本的理解与输出能力,平移到语音领域。
这就是趣丸“音频大模型”MaskGCT的序章,也是趣丸转型AI的脉络。如今的X项目组改名为人工智能事业部。宋克在采访中一直强调,趣丸不是为了AI而AI,而是在发现用户需求与解决问题的逻辑下,顺其自然。
AI前后,同与不同
宋克还记得ChatGPT带来的震撼,它把AI分出前后两个时代。趣丸最开始做数字人的时候,用的是传统建模技术,“特别麻烦”。宋克说,过程中用到很多相机,对一个人拍个半天,这人还要说很多的话,才能做出来。
[加西网正招聘多名全职sales 待遇优]
分享: |
Note: | _VIEW_NEWS_FULL |
延伸阅读 |
推荐: