免费开源批量离线文字识别Umi-OCR软件

Umi-OCR文本识别工具是一款免费、开源、批量离线的OCR软件;适用于Windows10,11平台。

  • 免费:这个项目的所有代码都是开源的,完全免费。
  • 方便:解压立即使用,离线操作,无需网络。
  • 批量:可以批量导入和处理图像,结果可以保存到本地txt/md/jsonl多格式文件。你也可以截屏,立即识别。
  • 高效:采用PaddleOCR-json C识别引擎。只要电脑有足够的性能,通常比在线OCR服务要快。
  • 精准:默认情况下使用PPOCR-v3模型库。除了能够准确识别常规字符,对于手写、方向不正确、背景凌乱等场景也有不错的识别率。可以设置忽略区域排除水印,文块后处理合并排版段落得到规则文本。

下载

海-OCR软件本体包含简体中文英文通用识别库。匹配多国语言识别扩展包可导入繁体中文、英文、日文、韩文、俄文、德文、法文的识别数据库,请按需下载。

Github下载:https://github.com/hiroi-sora/Umi-OCR/releases

网盘下载:Umi-OCR_文字识别工具 (lanzoul.com)

兼容性

系统支持Win10 x64及以上版本。CPU必须有AVX指令集。普通家用CPU一般满足这个条件。(初始化引擎故障时,请检查CPU是否兼容。看到楼下最上面的回复。)

简单上手

准备

下载压缩包,解压所有文件即可。

截图识别

点击截图按钮或自定义快捷键唤起截图识别。

粘贴图片到软件

把图片复制到任何地方(比如文件管理器、网页、微信),点击软件上的粘贴按钮,自动识别。

批量识别本地图片文件

文本块后处理功能

OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。

下图表示不同排版应该选用何种处理方案:

软件中有详细的提示。将鼠标悬停在设置项的UI上,显示提示框。更高级的功能描述,请看项目的Github页面。

忽略区域功能

忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。

通过设置页的 忽略区域编辑器 进入配置。

其他设置项

修复bug:重写快捷方式模块,引入pynput库,抛弃键盘库,解决概率失效、记录不正确等bug。新增功能:添加启动、桌面快捷方式和开始菜单快捷方式。新功能:打开更多软件时提示。新功能:截图时隐藏窗口。

调整UI:将频率极低的设置设为隐藏高级选项。优化:检查引擎组件是否存在。优化:横向布局-合并多行-自然段优化逻辑,支持首行0~2全角空格缩进。

下载权限

查看
  • Y
    免费下载
    评论并刷新后下载
    登录后下载

查看演示

  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
声明 本站部分资源来自网络,如有侵犯你的权益请联系管理员,仅供网友学习交流,若您喜欢本文可附上原文链接随意转载。无意侵害您的权益,请发送邮件至 oj88k@qq.com 或点击右侧 私信:优一阁 反馈,我们将尽快处理。

给TA打赏
共{{data.count}}人
人已打赏
WordPress主题

Puock一款基于WordPress开发的高颜值自适应开源主题已接入chatgpt功能

2023-3-16 15:09:23

教程分享

Google谷歌Bard人工智能开放申请

2023-3-23 19:07:03

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索