1234

ExcelHome技术论坛

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

帖子
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 277|回复: 10

[求助] 谁有比较不错的免费的OCR方案分享一下经验

[复制链接]

TA的精华主题

TA的得分主题

发表于 2025-3-5 17:12 | 显示全部楼层 |阅读模式
我想在我的PPT插件里面个OCR功能,方便有时扣图片上的文字。
  • 首先PPT里面自带OCR的是会员的,虽然不贵吧,但是怎么说呢,我的目的不是为了花钱,如果要花钱,大把的方案。
  • 我最先尝试的是windows自带的ocr,确实有个Windows.Media.Ocr的库,但是据说是为UWP项目使用的,后面又可以Winform使用了,在Nuget里面下了个Windows.SDK.Contract包,然后可以引用Windows.Media.Ocr的库了,编写代码一切正常,生成就找不到依赖,找不到这,找不到那。我觉得微软就是故意的,给很多东西的使用设置了坑,表面上大方开放,实际上要用太费劲了。各种程序的版本,程序集的引用,谁能知道才怪。谁搞成功了,科普一下引用步骤,要点也行。
  • 第三方OCR,我目前用的是Paddle的OCR,这个玩意儿据说识别效果还是可以,但是不知道是不是现在发展壮大了,现在也不再是那种短小精干的类型,很臃肿了。搞了个能下的,我原本的2~3M以内的插件,直接干倒500~600M了,光几个OCR的模型就3~400M了。至于嘛!另外,识别速度也是不算快,这个可能跟它体积雍总了有关。我就感觉下好包后,VS 编辑器界面提示都变慢了。。。网上不是说有10来M的小模型吗?我不需要识别80种语言....谁有引用它的轻量级模型的步骤,方法,科普一下也行。
  • 微信的OCR,网上也有介绍调用微信OCR的,我看了一下,一般都是说调用的WeChatOCR.exe这个应用程序。其实我自己之前就是将图片粘到聊天框,然后打开后用微信的OCR,但是这样跨软件搞,感觉挺累的。如果能集成到插件里就太好了。结果我今天看了一下,微信的安装文件夹下,已经没有WeChatOCR.exe,有的只是WeChatOCR.bin,是不是微信知道有人跳过微信程序这么用OCR,直接就给把这条路给堵了??谁有以前的复制到本地,现在也可以使用的套件包,分享一下也行。

还有什么好的方案吗?就想识别个中文,就要个轻量模型,免费的。


评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2025-3-6 17:28 | 显示全部楼层
目前用的上面的第三个方案,第三方的OCR,两个不满意的地方,一个是包太大了。把我的2~3M的小插件搞成几百M的软件了。第二个是速度有点感人,看下面的图中就那么几个字,也要1,2s了吧,字稍微多点,可能4,5s都有,识别率就算了,其实90%以上我都能接受,那有OCR完了核都不核一下的。

OCR.gif

期待更优方案。。。。

TA的精华主题

TA的得分主题

发表于 2025-3-10 22:37 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
https://www.52pojie.cn/thread-1998491-1-1.html

TA的精华主题

TA的得分主题

 楼主| 发表于 2025-3-12 11:42 | 显示全部楼层
woxoo 发表于 2025-3-10 22:37
https://www.52pojie.cn/thread-1998491-1-1.html

这个是个成品,没公布C#代码,或者接口,用不到我的插件里面了。不过好在带必要的文件。
网上能找到一个Python调用微信的开源程序,但是我python我不会啊,先转C#研究研究。
唉,这东西是逆向出来的,套了N个壳子。。。
希望能研究点眉目出来。

TA的精华主题

TA的得分主题

 楼主| 发表于 2025-3-12 17:28 | 显示全部楼层
woxoo 发表于 2025-3-10 22:37
https://www.52pojie.cn/thread-1998491-1-1.html

终于从GitHub上找了一个调用微信OCR的代码,直接60M的体量了!感谢

TA的精华主题

TA的得分主题

发表于 2025-3-12 20:52 来自手机 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2025-3-12 20:54 来自手机 | 显示全部楼层
微信的安装文件夹下,已经没有WeChatOCR.exe,有的只是WeChatOCR.bin,,那你是怎么调用的

TA的精华主题

TA的得分主题

 楼主| 发表于 2025-3-13 09:02 | 显示全部楼层
逍遥爱迪生 发表于 2025-3-12 20:54
微信的安装文件夹下,已经没有WeChatOCR.exe,有的只是WeChatOCR.bin,,那你是怎么调用的

已经将之前版本的相关程序拷贝出来了,不是访问的微信文件夹,就是独立于微信之外了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2025-3-13 17:41 | 显示全部楼层
折腾了一遍OCR,分享一下感受吧。
1. 在VSTO里面使用Windows.Media.Ocr,似乎此路不通,不说了。
2.使用第三方开源的OCR
(1)用了Paddle的OCR,有2个感觉,跟前面的一样,会让软件体量变得非常大,可能达到500M+,而且识别时间似乎有点长。但是不得不说,识别率是杠杠的,在那种花里胡哨的照片里面也能找到文字识别。但是不是特别适合Office插件,可以搞车牌识别。尤其是文字还有竖排,倾斜颠倒之类的。还是识别率很高的。但是作为一个小插件,没有那么高要求。还有就是安装比较麻烦,依赖多,但是使用还是比较方便。
(2)Paddle还有个轻量级的OCRSharp,但是也有上面的两个问题,不过就是大小减少到200M+等级了,问题跟上面的类似。
(3)tesseract 5.0,安装简单,模型也是比较友好,根据需求添加中文或者其他的语言,仅中文横向排版的模型40M+,编译完成最后80M+,体量也算不错了。但是使用起来有点怪怪的。还有就是中文识别率不高。同一个图片,多次识别可能出不同结果。中文模型数据都是7年前的,训练的不够好。
3.借用微信的“OCR”,把调用代码搞定了,目前来看还真是最好用的,已经跟微信本身没关系了。除了开始启动慢点,后面识别速度也快,体量60M,基本就是微信的几个文件。不过微信基本还是用在一些文稿扫描件类似的场景,照片、竖排文字的识别率不如Paddle,但前面也说了,我还真没那么复杂的应用场景。
感兴趣的可以去GitHub上看看
https://github.com/blueveryday/WeChatOCR
https://github.com/ZGGSONG/WeChatOcr
效果如下(图片糊是受限于GIF的文件大小,编码质量不高):
OCR.gif

TA的精华主题

TA的得分主题

发表于 2025-3-17 12:35 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Enocheasty 发表于 2025-3-13 17:41
折腾了一遍OCR,分享一下感受吧。
1. 在VSTO里面使用Windows.Media.Ocr,似乎此路不通,不说了。
2.使用 ...

这个网页打开不吗?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

1234

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-3-26 12:29 , Processed in 0.026013 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表