|
首先感谢大佬用心辛苦做的这个PDF库,代码略改下就可以直接应用,用的很省心
我主要用来做货运的数电发票电子件配对[xml+zip(xml)+xlsx]的配对,并且配对成功后批量添加水印按顺序打印的
之前pdf的部分是用python做的Onefile的exe,然后用vba调用, 虽然能用,但是不能流畅融入到我整个项目流程中去
关于大佬库我主要用了3个功能,给大佬汇报下
- 添加文本:非常好用
- 合并pdf:非常好用
- 提取文本:我的项目中提取pdf版本数电发票内容与xml版本比对,目前最大的pdf就4页,完全一致
关于提取文本,反馈一个问题,《2014版新企业会计准则.pdf》测试了不知道为何,总少了最后一页
- Sub CC_提取PDF文本()
-
- Dim PathPDF, PathSave, StrPages, StrArea, ZCM As String
- Dim BL As Boolean
-
- Rem 先注册DLL文件 执行BAT文件即可: 自动注册类库_32_64位_运行2次
- Rem 注册成功后 其实可以在引用中找到: GTDPDFPlugIn
- Dim PDFDLL As Object
- Rem 创建函数类对象 CreateObject 不需要提前引用
- Set PDFDLL = CreateObject("GTDPDFPlugIn.PDFClass") 'DLL文件内Class的名称 现在如无意外,就可以创建一个MyDLLClass对象,YEAH!
-
-
- Rem 参数值 见上方的说明
- PathPDF = ThisWorkbook.Path & "\2014版新企业会计准则.PDF"
- PathSave = ThisWorkbook.Path & "\2014版新企业会计准则.txt"
-
- StrPages = ""
- StrArea = ""
-
- ZCM = "QQ14885553"
- PassWord = ""
-
- BL = PDFDLL.ExtractTextFromPDF(PathPDF:=PathPDF, PathSave:=PathSave, StrPages:=StrPages, StrArea:=StrArea, PassWord:=PassWord, ZCM:=ZCM)
- Set PDFDLL = Nothing
- MsgBox BL
-
- End Sub
复制代码
pdf见网盘
链接: https://pan.baidu.com/s/1JRKBt3Z-X0RosSkt8g1P1A?pwd=cixh 提取码: cixh 复制这段内容后打开百度网盘手机App,操作更方便哦
pdf的截图
提取的txt截图
可见代码转出来少了最后一页,我当时另外找了一个文件比这个还大,但是提取出来正常。
不知道是不是这个pdf文件本身的原因还是其他的原因,望大佬有时间测试下。
再次感谢大佬的库
|
|