软件分类 游戏分类 资讯分类

原创百度文心PaddleOCR-VL-1.6正式发布,文档理解准确率突破96.33%

编辑:pcsoft资讯 时间:2026-06-12 17:58:07

      百度最新发布了文心衍生模型PaddleOCR-VL-1.6.在权威评测中准确率突破96.3%,综合性能拿下全球第一,强势刷新业界SOTA!它不仅在文本、公式、表格识别上全面领先,更在扫描、弯折、倾斜等真实复杂场景中表现硬核。保持0.9B轻量架构的同时能力大增,还能无缝迁移,开源即飙星。

      一、成绩霸榜全球第一

      在权威评测OmniDocBench v1.6中,准确率飙到96.33%,把GPT-5.2、Gemini-3-Pro等一众强敌甩在身后。在真实复杂场景评测中同样拿下93.19%,比Gemini高出近4个百分点,综合实力妥妥的全球第一。

      二、复杂场景硬核突破

      不管是表格、古籍还是生僻字,识别能力都大幅提升。面对扫描件、弯折文档、屏幕拍照、光照变化和倾斜文档这五大真实痛点,它依然稳如泰山,轻松搞定各种复杂文档数字化需求。

      三、轻量架构平滑升级

      基于文心大模型训练,支持超100种语言。这次在0.9B轻量化架构下实现了能力跃升,而且跟1.5版本结构一致,开发者和企业无需额外适配,直接无痛平滑迁移。

      四、开源即火爆全球

      PaddleOCR在GitHub上星标已破79.2K,超越谷歌成为全球最受欢迎的开源OCR项目之一。目前1.6版本已在官网支持网页端和API调用,代码和权重也同步开源到了GitHub和Hugging Face,开发者赶紧用起来。

热门推荐

相关文章