OpenAI新模型: 有情绪的AI出现了
正如Sam Altamn所说,正是在这个背景下,属于每个人的云端情人HER到来了。
可惜的是,OpenAI的技术文档对此只字未提。我们也无法对它进行更深入的解读了。一个可能的猜测是,这是OpenAI在训练端到端语音模型中自发涌现出的一种新的模型能力。
可以想见的是,在GPT-4o的魔法影响下,AI交友、AI心理咨询师等等所有需要强情绪交互的赛道都会很快就变成一片蓝海。
4、魔法之旅刚刚开始,真·多模态的能力也许远不止于此
情感识别和适配,也许是GPT-4o作为统一多模态模型所涌现出来的一种非常强大的能力。但它潜在的可能性并不止于。如GregBrockman在推特上的发声,GPT-4o通过音频、文本、图像输出的任意组合,可以无限解锁新的功能。而OpneAI对这些新涌现也不过只是瞥见了一小部分。

这一小部分也已经非常惊人了。除了在直播中重点强调的功能,在OpenAI的技术文档中,我们看到在GPT4-o的能力列表中,还包含3D能力、图像诗能力、转换卡通照片等能力。

图注:OpenAI官方Blog中的能力探索列表
比如:生成3D模型的魔法

像波德莱尔那帮现代主义诗人一样,用诗歌或logo填满规定的形象。

[加西网正招聘多名全职sales 待遇优]
还没人说话啊,我想来说几句
可惜的是,OpenAI的技术文档对此只字未提。我们也无法对它进行更深入的解读了。一个可能的猜测是,这是OpenAI在训练端到端语音模型中自发涌现出的一种新的模型能力。
可以想见的是,在GPT-4o的魔法影响下,AI交友、AI心理咨询师等等所有需要强情绪交互的赛道都会很快就变成一片蓝海。
4、魔法之旅刚刚开始,真·多模态的能力也许远不止于此
情感识别和适配,也许是GPT-4o作为统一多模态模型所涌现出来的一种非常强大的能力。但它潜在的可能性并不止于。如GregBrockman在推特上的发声,GPT-4o通过音频、文本、图像输出的任意组合,可以无限解锁新的功能。而OpneAI对这些新涌现也不过只是瞥见了一小部分。

这一小部分也已经非常惊人了。除了在直播中重点强调的功能,在OpenAI的技术文档中,我们看到在GPT4-o的能力列表中,还包含3D能力、图像诗能力、转换卡通照片等能力。

图注:OpenAI官方Blog中的能力探索列表
比如:生成3D模型的魔法

像波德莱尔那帮现代主义诗人一样,用诗歌或logo填满规定的形象。

[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:



