OpenAI新模型: 有情緒的AI出現了

圖注:文本推理能力提高有限

圖注:與Whisper-v3相比,GPT-4o在多種語言的識別表現優異,尤其是小語種語言

圖注:GPT-4o在音頻翻譯表現上達到新的高水准

圖注:在多項基准測試上,分數都有提高,在視覺理解的測試上,GPT-4o達到新的高水准
2、易用性的魔法:OpenAI教蘋果、谷歌做語音助手
雖然在能力上,大壹統的多模態模型和Gemini壹樣並沒帶來想象中的性能巨幅提升。但OpenAI明顯比谷歌多走了壹步:用壹個統合的助手在所有場景下應用所有這些多模態。
就從這次演示來看,這壹交互層面的升級才證明了多模態確實是AI的GameChanger。
更強的是手機版的GPT-4o可以通過語音能力理解你的話語,狀態(累不累,喘氣粗不粗)。
還能通過視覺識別你所處的環境和你正在做的事情,並對它作出反應。幫你解數學題,沒問題,解完還能陪你聊聊人生。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:
OpenAI新模型: 有情緒的AI出現了