全球唯一可在浏览器运行的高精度OCR来了！最快 97 毫秒完成识别-赛迪网 - 集科技期刊、产业信息资讯、网络新媒体、视频新媒体于一体的融媒体智能化传播平台

首页> 新闻> 正文

全球唯一可在浏览器运行的高精度OCR来了！最快 97 毫秒完成识别

来源：赛迪网作者：赛迪网 2026-06-15 16:36:23

【赛迪网讯】近日，百度文心正式发布新一代OCR模型PP-OCRv6，一次性推出Tiny、Small、Medium三档模型，支持 50 多种语言，覆盖浏览器端、嵌入式设备到服务器等主流场景。公开结果显示，PP-OCRv6再次刷新OCR领域评测纪录，综合性能位居全球第一。

其中，PP-OCRv6 Tiny的尺寸仅1.5MB，可直接部署于本地浏览器环境，单图预测最快仅需 97 毫秒。用户数据无需上传云端即可完成OCR处理，在保障隐私安全的同时，大幅降低部署门槛。有开发者评价，PP-OCRv6可能是全球唯一可在浏览器环境运行的高精度OCR模型，为 Agent 装上一双眼睛，能够在智能办公、教育、工业等场景提供更加轻量、高效的视觉感知能力。

在性能方面，PP-OCRv6在保持轻量化优势的同时进一步提升识别精度和推理速度，综合性能显著增强。PP-OCRv6在文本检测和文本识别任务中分别取得86.2和83.2的成绩，双双刷新此前由PP-OCRv5保持的OCR领域最佳水平，整体表现领先于Qwen3-VL-235B、GPT-5.5、Gemini-3.1-Pro等国内外主流多模态大模型，在OCR专业任务上展现出更强竞争力。

作为文心大模型多模态能力的重要组成部分，PP-OCR系列近年来持续推进文本检测与识别技术升级，先后推出PP-OCRv1至PP-OCRv6等多个版本。目前，PP-OCR系列所在的PaddleOCR项目已支持超110种语言识别，服务覆盖全球170多个国家和地区。

凭借轻量化、高精度等特点，PP-OCR系列已被广泛集成至UmiOCR、MinerU、TurboOCR等业界OCR工具链中，并应用于文档解析、数据处理、知识库构建等场景，成为开发者和企业常用的开源OCR解决方案之一；同时，PP-OCR系列也成为各大模型团队开展数据预处理、文档解析和知识提取的重要工具，为模型训练与应用落地提供支持。在GitHub上，PaddleOCR的Star数量已突破8.22万，超过谷歌旗下开源OCR标杆产品Tesseract OCR，成为全球最受关注的开源OCR项目之一。

目前，PP-OCRv6 已上线 PaddleOCR 官网，用户可通过网页或API方式快速使用，代码和模型权重也已开源至 Github 和 HuggingFace，服务广大用户下载和使用。

360发布《2026攻防演练必修漏洞清单》 AI基础设施首次被列为独...

近日，360数字安全集团漏洞研究院发布《2026攻防演练必修漏洞清单》，系统梳理了政企单位在国家级攻防演…

10小时前

拼多多雄安新公司迎首批员工，150名新员工正式完成签约

6月15日，拼多多雄安新公司迎来首批员工，150名新员工已通过公司直签的方式完成入职，成为雄安新公司发展…

8小时前

你可能也喜欢这些文章