Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_20e79db4d750c542da7a9e79aeb94807, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
实测DeepSeek"识图模式":连自己老板都不认识 | 温哥华地产中心
   

实测DeepSeek"识图模式":连自己老板都不认识

红星资本局6月19日消息,6月18日,DeepSeek网页及APP端,均新增了“识图模式”,并显示“图片理解功能内测中”。同一天,DeepSeek多模态团队负责人陈小康在社交媒体上发文称,视觉模式已在网页和应用上正式上线,“试试这双新眼睛”。


6月19日,红星资本局实测发现,DeepSeek的识图功能并不太稳定。

红星资本局实测时上传了一张DeepSeek创始人梁文锋的照片,但DeepSeek将其识别为字节跳动的张一鸣;紧接着再上传另外一张梁文锋的照片,DeepSeek仍然认为是张一鸣;最后上传了张一鸣的照片,DeepSeek识别正确。

随后红星资本局开启新对话,重新上传张一鸣的照片,DeepSeek将其识别为寒武纪创始人陈天石;紧接着上传梁文锋的照片,DeepSeek仍然认为照片中的人是陈天石。在多次对话中,DeepSeek还曾表示“无法回答问题”。

该图片疑似使用了AI生成技术,请谨慎甄别



DeepSeek在回答中表示,目前的“识图功能”其实是“读图”。

DeepSeek目前支持的图像文件上传和视觉识别为OCR模型,即读取图像中的文本,擅长从上传的图像(PDF、Word、Excel、PPT、JPG等)中读取文本,并处理该文本;而不是多模态视觉语言模型(VLM),无法以像素级别“看到”物体、人脸或场景。

对于将梁文锋识别成其他人,DeepSeek再次表示自己没有人脸识别模块,不会“看脸”只会“看字”,如果照片中只有一张脸,“我只能回复你图片中没有文字内容”。

于是红星资本局又上传了其他带有文字的图片,对于“货拉拉被约谈”的新闻资讯的封面,DeepSeek基本可以识别出图中内容,但将图中的“货拉拉”识别为“货拉业”,并认为是图片中的字打错了。对于“新东方集团总结大会”视频截图,DeepSeek可识别出图中的信息,并且精确捕捉到俞敏洪也在图片中。




对于纯文本类的图片,红星资本局选择了怀素的草书作品,DeepSeek可以识别部分文字,但将图中的“玉露凋伤枫树林”,识别为“王右丞诗枫桥”。对于Yum! Brands宣布出售必胜客业务的英文公告截图,DeepSeek可正确识别并翻译。

该图片疑似使用了AI生成技术,请谨慎甄别



[加西网正招聘多名全职sales 待遇优]
这条新闻还没有人评论喔,等着您的高见呢
上一页12下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    DeepSeek之后,中国又一开源AI模型引发硅谷热议 DeepSeek识图:两次上传梁文锋照片都识别成张一鸣
    DeepSeek融资510亿估值4000亿:梁文锋为何选腾讯? 美国迟迟未对DeepSeek等中企动手 原因曝光
    美国政府暂缓拉黑DeepSeek,长鑫存储等百余家中企 路透:美暂缓将DeepSeek等列黑名单 避免激怒北京
    微软考虑使用DeepSeek开发低成本Copilot软件 美国企业重新给DeepSeek打钱!登顶新增采购榜
    估值四千亿 DeepSeek被曝开启中国AI最大规模融资 华为"韬定律"刷屏:中国芯片迎来"DeepSeek时刻"了?
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)

    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站