Umi-OCR文本识别工具是一款免费、开源、批量离线的OCR软件;适用于Windows10,11平台。
- 免费:这个项目的所有代码都是开源的,完全免费。
- 方便:解压立即使用,离线操作,无需网络。
- 批量:可以批量导入和处理图像,结果可以保存到本地txt/md/jsonl多格式文件。你也可以截屏,立即识别。
- 高效:采用PaddleOCR-json C识别引擎。只要电脑有足够的性能,通常比在线OCR服务要快。
- 精准:默认情况下使用PPOCR-v3模型库。除了能够准确识别常规字符,对于手写、方向不正确、背景凌乱等场景也有不错的识别率。可以设置忽略区域排除水印,文块后处理合并排版段落得到规则文本。

下载
海-OCR软件本体包含简体中文英文通用识别库。匹配多国语言识别扩展包可导入繁体中文、英文、日文、韩文、俄文、德文、法文的识别数据库,请按需下载。
Github下载:https://github.com/hiroi-sora/Umi-OCR/releases
网盘下载:Umi-OCR_文字识别工具 (lanzoul.com)
兼容性
系统支持Win10 x64及以上版本。CPU必须有AVX指令集。普通家用CPU一般满足这个条件。(初始化引擎故障时,请检查CPU是否兼容。看到楼下最上面的回复。)
简单上手
准备
下载压缩包,解压所有文件即可。
截图识别
点击截图按钮或自定义快捷键唤起截图识别。

粘贴图片到软件
把图片复制到任何地方(比如文件管理器、网页、微信),点击软件上的粘贴按钮,自动识别。

批量识别本地图片文件

文本块后处理功能
OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。
下图表示不同排版应该选用何种处理方案:
软件中有详细的提示。将鼠标悬停在设置项的UI上,显示提示框。更高级的功能描述,请看项目的Github页面。

忽略区域功能
忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。
通过设置页的 忽略区域编辑器
进入配置。
其他设置项
修复bug:重写快捷方式模块,引入pynput库,抛弃键盘库,解决概率失效、记录不正确等bug。新增功能:添加启动、桌面快捷方式和开始菜单快捷方式。新功能:打开更多软件时提示。新功能:截图时隐藏窗口。
调整UI:将频率极低的设置设为隐藏高级选项。优化:检查引擎组件是否存在。优化:横向布局-合并多行-自然段优化逻辑,支持首行0~2全角空格缩进。