ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1031|回复: 8

[求助] 有偿求助,如何利用宏提取文件夹中PDF指定位置内容并生成汇总表

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-4-30 00:19 | 显示全部楼层 |阅读模式
如题,客户要求将文件夹中《免税确认通知书》(PDF格式)的内容定期统计汇总。《通知书》有很多份,目前只能一份份的打开并在对应内容处一项一项的复制粘贴。本人想把它们发在一个文件夹内。然后通过EXCEL宏,1键提取这个文件夹里所有《通知书》的内容并形成汇总表。


谢谢!

附件一:提取后汇总.xls(我想要的内容呈现效果及解释说明)
附件二:免税确认通知书3份(实际中不止3份)

案例.zip

546.08 KB, 下载次数: 31

TA的精华主题

TA的得分主题

发表于 2023-4-30 05:34 | 显示全部楼层
挺规整的,pdf转txt然后当成文本处理,应该可行

image.png

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-4-30 07:53 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 opiona 于 2023-4-30 07:58 编辑

可以使用VBA直接获取文本内容(35楼),或使用DLL获取
(DLL可以获取扫描后的内容,VBA不能)
然后对文本进行正则等操作,获取需要的数据
https://club.excelhome.net/thread-1654951-1-1.html

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-4-30 08:15 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
转换为excel格式再统计

Desktop.rar

33.04 KB, 下载次数: 47

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-4-30 09:50 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-4-30 12:51 来自手机 | 显示全部楼层
1.转txt
Screenshot_2023-04-30-12-47-10-915_com.termux.jpg
Screenshot_2023-04-30-12-47-21-062_com.termux.jpg
2.正则表达式
Screenshot_2023-04-30-12-46-54-767_cn.uujian.browser.jpg
create temp table aa as
select fillna(iif(F_A like '%中华人民共和国海关%',rowid,'')) newid,*,regexp2('编号:(\S+)',F_A,1) 免表编号,regexp2('减免税申请人\s*(\S+)\s',F_A,1) 减免税申请人
,replace(regexp2('\d{8}\.\d\d',F_A),'.','') 商品编号
from 正则表达式拆分海关退税数据;
create temp table bb as
select newid,group_concat(免表编号,'') 免表编号,fillna(group_concat(减免税申请人,'')) 减免税申请人,udf_trim(group_concat(商品编号,' ')) 商品编号   from aa group by newid;
cli_split_data~bb~\s~商品编号;
select 免表编号,减免税申请人,商品编号 from bbsplit where 商品编号!='';

TA的精华主题

TA的得分主题

发表于 2023-4-30 15:45 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
要将pdf输出成文本文件,pdftotext不香么?
一个高效的命令行工具,开源,免费,可在linux和windows上使用:简称pdftotext.该工具是xpdf库的一部分.

http://en.wikipedia.org/wiki/Pdftotext

使用方法详见https://wenku.baidu.com/view/931 ... D%E4%BB%A4%E8%A1%8C

可以在VBA中直接执行命令行来调用Pdftotext,纯绿色软件,无需注册,无需引用,对终端用户友好。

TA的精华主题

TA的得分主题

发表于 2023-4-30 20:01 | 显示全部楼层
lxw6 发表于 2023-4-30 15:45
要将pdf输出成文本文件,pdftotext不香么?
一个高效的命令行工具,开源,免费,可在linux和windows上使用:简 ...

为啥 http://en.wikipedia.org/wiki/Pdftotext 打不开呢?

TA的精华主题

TA的得分主题

发表于 2023-5-2 12:20 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Snipaste_2023-05-02_12-14-28.png


界面工具,如果有需要可以增加命令行参数调用。

联系方式: 微信weichaoxian86
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-17 03:40 , Processed in 0.045986 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表