塔斯娱乐资讯网

刚试了DeepSeek的看图功能,国产AI这次有点东西!DeepSeek是国产识

刚试了DeepSeek的看图功能,国产AI这次有点东西!DeepSeek是国产识图最强AI吗

之前一直觉得这种看图说话的功能是GPT-4V那些国外模型的强项,国产的好像总差点意思。但这次DeepSeek给我的感觉还挺意外的。

我随手传了张前几天拍的公园照片,它不光是能说出基础信息,还能描述出傍晚时分,阳光斜照在长椅上,远处有人遛狗,这种带点氛围感的细节。最让我觉得厉害的是,我传了张带复杂表格的截图问它数据,它居然能把里面的关键数字和趋势给我提炼出来,逻辑挺清晰的。

看网上的技术分析说,它这次用的是一种叫视觉原语思考的新方法,简单说就是像人用手指着东西思考一样,在处理数人数,找位置这种需要精准指代的任务时,比光靠语言描述要准得多,而且处理图片的成本还特别低。

当然,它肯定不是完美的。比如生成图片、理解视频这些更高级的能力还没上线,在一些特别刁钻的图形推理题上可能也会出错。但作为一个刚大规模开放的功能,能做到理解准确、反应快、而且对普通用户免费,我觉得已经非常有诚意了。

总的来说,感觉国产AI在多模态这条赛道上,终于不再是单纯追赶,开始在某些细分点上,展现出自己的特色和优势了。DeepSeek这次入场,至少把好用不贵的标杆立起来了,给咱们用户多了一个高质量的选择。期待它后续的更新!