DeepSeek-OCR2升级:视觉编码器革命,文档识别准确度飙升3.73%!
创始人
2026-01-27 14:30:44
0

1月27日,DeepSeek发布了其最新升级的文档识别模型DeepSeek-OCR2。该模型在DeepSeek-OCR的基础上进行了核心升级,主要变化在于视觉编码器设计。研究团队提出了DeepEncoderV2新型编码器结构,能够根据图像语义动态调整视觉信息处理顺序,使模型在文字识别前先对视觉内容进行智能排序。

DeepSeek-OCR2引入了“视觉因果流”概念,用类语言模型结构替代了原先基于CLIP的视觉编码模块,并在编码器内部引入可学习的“因果流查询token”。编码器同时包含双向注意力与因果注意力两种处理模式,原始视觉信息通过双向注意力进行全局感知,而新增的查询标记则通过因果注意力逐步建立语义顺序,从而在编码阶段对视觉token的顺序进行动态重排。

在性能测试中,DeepSeek-OCR2在OmniDocBenchv1.5基准上的整体得分达到91.09%,相较前代模型提升了3.73%。特别是在阅读顺序准确度方面,编辑距离从0.085降至0.057,表明新模型能够更合理地理解文档内容结构。此外,DeepSeek-OCR2在生产环境中也表现出更好的稳定性,在线用户日志图像的重复率和批处理PDF数据的重复率均有所降低。

相关内容

热门资讯

小鹏MONAO3上市,欧阳娜娜... 今日,小鹏汽车在2026款小鹏MONAMO3上市发布会上,小鹏集团董事长CEO何小鹏及MONA产品负...
蔚来焕新版萤火虫升级上市,售价... 4月7日,蔚来汽车宣布旗下焕新版firefly萤火虫焕新升级款正式上市,整车购买售价区间为11.98...
女子称6.8万元买的紫貂被朋友... 4月5日,媒体报道浙江一女子发布视频称,朋友未经允许穿自己新买的紫貂。女子发现后,第一时间要求朋友当...
别只盯着莫氏鸡煲!广州越秀也藏... 最近,广东佛山的“莫氏鸡煲”火爆全网,面对每天慕名而来的上千食客,老板忙得直言“不愿营业”。这背后,...
国际观察|“战争税”如何侵蚀美... 新华社北京4月7日电 题:“战争税”如何侵蚀美国经济新华社记者宿亮“战争税正打击美国企业与消费者!”...
凡人微光 | 春天,是场热气腾... 策划:卓越、郭凌志统筹:崔莺馨、冯子雄、郭子腾、杨亮、王若溪、周晨、李金枝制作:沙琳参与:陈熠瑶出品...
从广东到捷克,一把无弦吉他的“... “在我手里的是一款更小巧的LiberLive U1无弦吉他,这是我们今年推出的最新款产品,计划今年1...
在美方支持下,以军战机袭击伊朗... 据伊朗迈赫尔通讯社7日报道,在美方支持下,以军战机当天上午袭击伊朗厄尔布尔士省多处居民区,导致18人...
全球媒体聚焦 | 美媒:美国或... 美国《国会山报》近日发表题为《美国或将陷入史上最严重经济衰退》的评论文章。文章说,这是一场真正的衰退...
新场景激发新动能 释放假期消费... 央视新闻客户端消息(新闻联播):清明假期,全国商品消费提质扩容,智能、绿色化升级趋势明显,服务消费需...
特朗普再发威胁:7日20时是“... 当地时间4月6日,美国总统特朗普在白宫举行新闻发布会当地时间4月6日,在白宫举行的新闻发布会上,美国...
新疆以花为媒 绘旅游新图景 随着春意渐浓,天山南北繁花竞放,新疆各地纷纷以花为媒,迎八方游客。这段时间,在塔克拉玛干沙漠南缘的和...
河源推“借道通行”等举措 三招... 河源公安推“借道通行、隧道不测速、潮汐服务区”,全力护航清明假期高速出行羊城晚报讯 记者张璐瑶报道:...
日本拟放宽武器出口限制引发舆论... 新华社东京4月6日电(记者李子越 陈泽安)据日本共同社报道,日本自民党安全保障调查会6日召开会议,讨...
柠檬艾草是驱蚊利器?效果有限! 不少市民近日发现,今年的蚊子似乎格外多,互联网上甚至出现蚊子“史诗级加强”等词条。不少网友分享自己的...
以天下为己任 为强国而读书 今年,“全民阅读”已是第13次被写入政府工作报告。随着《全民阅读促进条例》落地实施、“十五五”规划纲...
米兰小哥今日抵粤探广货 一颗酥心糖的米兰奇遇记,引发一场温暖全网的民间接力,书写出一则中意民间交流的暖心佳话羊城晚报记者 余...
以青春为笔,作答时代的问卷 策划/龚丹枫统筹/王倩执行/秦小杰海报/范英兰文/羊城晚报记者 秦小杰青春从不是温室里的娇养,而是在...