ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: hhmxxx

[原创] 在Excel中使用开源的Ocr引擎tesseract-ocr识别文字和验证码[20120718更新]

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2012-8-5 16:23 | 显示全部楼层
本帖已被收录到知识树中,索引项:图像处理和GDI
liucqa 发表于 2012-8-4 22:59
俺说句实在话,你别生气。

可以用了。先前下载错了文件哈!

TA的精华主题

TA的得分主题

发表于 2012-8-7 14:41 | 显示全部楼层
楼主作品甚让人惊讶,只是2003看不到代码,很是遗憾。能否展示一下代码?

TA的精华主题

TA的得分主题

发表于 2012-8-7 21:21 | 显示全部楼层
本帖最后由 cumulonimbus 于 2012-8-7 21:25 编辑

MyStr = FMyFuns.TsOcr(FullName, "3", "6", "0", "eng")
请问这个函数要咋用?

第二个为引擎模式EngineMode = (emTesseractOnly, emCubeOnly, emCombined, emDefault);第一个为0,依此类推
第三个为PageSegmentation = (psOSDOnly, psAutoOSD, psAutoOnly, psAuto, psSingleColumn, psSingleVerticalBlock, psSingleBlock, psSingleLine, psSingleWord, psCircleWord, psSingleChar);
第四个为PixelFormat = (piAuto, pi8bit, pi24bit, pi32bit);
不太明白具体选择时要怎么用,楼主可否指导一二,谢谢。

TA的精华主题

TA的得分主题

发表于 2012-9-12 09:08 | 显示全部楼层
liucqa 发表于 2012-7-18 21:55
楼主作品
  xll调用

咋回事。我的机子太敏感了吗?一下来就被360杀了。
未命名.jpg

TA的精华主题

TA的得分主题

发表于 2012-9-12 11:10 | 显示全部楼层
cumulonimbus 发表于 2012-9-12 09:08
咋回事。我的机子太敏感了吗?一下来就被360杀了。

问楼主,不要问我,我只管上传。

TA的精华主题

TA的得分主题

发表于 2012-10-17 22:54 | 显示全部楼层
不知什么原因执行 Ocr示例.xlsm 出现 ‘OCR 出错,确定‘

TA的精华主题

TA的得分主题

发表于 2012-10-17 23:42 来自手机 | 显示全部楼层
本帖最后由 hyy514 于 2012-10-18 00:02 编辑
cumulonimbus 发表于 2012-9-12 09:08
咋回事。我的机子太敏感了吗?一下来就被360杀了。


截图,必然有拷屏的api,还有hook、shell、一些下载类的api、xmlhttp类+有进程类操作的语句。只要有以上之一的代码封装起来,哪怕只几句代码,360百分之百报木马,这个我深有体会。360就是个250,除非作者到360买签名,交年费,签名之后就不会报,这可是360的收入来源之一。
对不放心的东西,可以上传到这里virscan.org扫描下,能通过基本可以无视360,这是我的经验。

TA的精华主题

TA的得分主题

发表于 2012-11-30 09:21 | 显示全部楼层
无比膜拜中!先收藏起来,等空下来了再研究……
一直想找个OCR的程序,识别某些文档中的字符,如果成的话,能干的事就大大增加了!多谢楼主的分享!!!

TA的精华主题

TA的得分主题

发表于 2012-12-8 21:06 | 显示全部楼层
本帖最后由 liucqa 于 2012-12-8 21:21 编辑

楼主作品,XLL加载宏

Img2Pdf.rar (561.73 KB, 下载次数: 101)

播放flash组件.rar (380.9 KB, 下载次数: 81)




TA的精华主题

TA的得分主题

发表于 2013-2-14 18:29 | 显示全部楼层
楼主作品  pdf2img

Pdf2Img.part1.rar (1.17 MB, 下载次数: 124) Pdf2Img.part2.rar (1.17 MB, 下载次数: 125) Pdf2Img.part3.rar (563.11 KB, 下载次数: 97)

'函数原型:function UDF_PDF2Img(FileIn,FolderOut,FileOut,MyStartPage,MyEndPage,MyDPI,MyFormat:PAnsiChar): lpxloper; stdcall;
'FileIn:输入的PDF文件
'FolderOut:输出的文件所在的文件夹
'FileOut:输出的文件名称,比如 "output.jpg" ,"out%pput.jpg" ,"%p"将以页数代替,文件名中不加%p的话将把页数加在扩展名之前
'MyStartPage,开始的页数
'MyEndPage,结束的页数,为0表示最后一页
'MyDPI: 生成图片文件的分辨率. 值72相当于 Acrobat 的 zoom level 100%.
'MyFormat:输出文件的格式
'0 = 输出BMP文件
'1 = 输出JPEG文件
'2 = 输出WMF文件
'3 = 输出EMF文件
'4 = 输出EPS文件
'5 = 输出PNG文件
'6 = 输出GIF文件
'7 = 输出TIFF文件
'8 = 输出EMF+文件
'9 = 输出HTML5文件
'10 =输出G4 TIFF文件
'函数执行成功返回"1",失败返回"0"或者"出错"

比如把d:\testme.pdf的第二页到最后一页转换成为jpg文件放到d:\下
Application.ExecuteExcel4Macro("UDF_PDF2Img(""D:\TestMe.pdf"",""D:\"",""page.jpg"",""2"",""0"",""144"",""1"")")

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-22 07:57 , Processed in 0.039811 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表