
6月18日,开DeepSeek的网页端和APP端,几乎所有用户会发现,在以往的快速模式和模式右边,多了个识图模式,这意味着,很多没有被灰度测试到的用户,终于可以用DeepSeek处理图片了。
目前DeepSeek官暂未发布公开介绍,在模型界面显示的也仍然是“图片理解内测中”,有猜测这次是全量测试送。不过,今天DeepSeek多模态团队负责人陈小康在社交媒体上提到的口吻是,视觉模式已在网页和应用上正式上线,“试试这双新眼睛”。
值得提的是,就在5天前,陈小康还紧跟热点,将鹅腿阿姨的“绿鸭腿”发给DeepSeek识别,从回复来看,DeepSeek能辨认出这不是鹅腿,同时提出这个绿有可能是食品安全隐患。“如果当年有DeepSeek,今年是不是就没有‘鸭骗战争’了。”他调侃。
在这评论区里,有用户提问为什么还用不上视觉,当时陈小康回复,“灰度(测试)只有少量用户能用到”。今年4月底,DeepSeek识图模式启动灰度测试,在5月进行了次大范围开放,但不少用户仍然没用上,直到这次似乎是面向所有用户开放测试了。
DeepSeek的识图果如何?财经记者上手感受了下,不同情境下的果不同。
发给DeepSeek张关于上海外滩的建筑图,问这是哪里,DeepSeek在用时16秒后就给出了正常答案,分析出了四个主要的建筑,并且还答出了白拱桥“大概率是乍浦路桥”,是经典摄影角度。
不过,换成这几天热门的佛得角守门员沃齐尼亚青海家具封边胶,DeepSeek就不定能认出来了。DeepSeek用了分多钟进行度思考,思考过程几次提到佛得角,泡沫板橡塑板专用胶但对应不上具体的球员,后给出了个错误的答案。
这或许是因为沃齐尼亚此前并不出名,大模型训练数据里并不涉及,同时DeepSeek的识图模式没有联网搜索的,因此法识别当下的热点人物。
记者注意到,在社交平台,有早就被灰度测试覆盖到的用户反馈,DeepSeek的识图能力过了国产模型的平均水平,但和海外顶模型相比,在复杂图片理解、细节理等面还有差距。
具体来看,如果是日常截图、报错信息、表格、论文、网页内容这类场景,DeepSeek的识图基本够用,且速度很快。但如果是较为复杂的图片,如多层逻辑流程图、复杂的数据图表准确率会开始下降。但上述用户认为,考虑到价格和开放程度,DeepSeek仍然值得用。
就在4月30日,DeepSeek曾发布了篇关于多模态技术报告《Thinking with Visaul Primitives》(《用视觉原语思考》),阐释了多模态技术背后的细节。但很快大发现,官连夜删除了多模态仓库和论文原文,开Github界面已经是“404”状态。
当时外界猜测很多,有的认为DeepSeek还未准备好,有的则认为是论文透露信息太多了。在论文中,DeepSeek认为,目前的多模态模型在复杂任务上崩溃,不是因为看不见(感知鸿沟),而在于“指不准”(引用鸿沟)。多模态智能的未来,不只是 “看见多像素”,而是构建语言与视觉之间、歧义的指代桥梁。
目前DeepSeek还未公开宣布识图模式上线,关于这模式的技术细节以及多消息,还需等待官的介绍。相关词条:储罐保温 异型材设备 钢绞线厂家 玻璃丝棉厂家 万能胶厂家
奥力斯 PVC管道管件粘结胶价格 联系人:王经理 手机:18231788377(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区/p>
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述青海家具封边胶,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。