ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1154|回复: 8

[求助] query可以批量抓取pdf格式的文件吗?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2021-4-27 13:11 | 显示全部楼层 |阅读模式
需要把PDF转成EXCEL吗?还是可以直接抓取?

TA的精华主题

TA的得分主题

发表于 2021-4-27 13:23 | 显示全部楼层
我试过POWER BI里可以导入PDF的表格源,但遇到PDF里表格不是很规范的时候 很容易报错。。。

TA的精华主题

TA的得分主题

发表于 2021-4-27 14:27 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-4-27 20:05 | 显示全部楼层
image.png

只能一个文件的转,怎么统一转文件夹下的多个PDF?

TA的精华主题

TA的得分主题

发表于 2021-4-30 10:22 | 显示全部楼层
deadzlq 发表于 2021-4-27 14:27
参考 Pdf.Tables 函数

如果我要用到EnforceBorderLines这个参数是true,应怎样写?

TA的精华主题

TA的得分主题

发表于 2021-4-30 12:56 | 显示全部楼层
本帖最后由 deadzlq 于 2021-4-30 15:33 编辑
HOTYEAH 发表于 2021-4-30 10:22
如果我要用到EnforceBorderLines这个参数是true,应怎样写?

=Pdf.Tables(File.Contents(PathFile),[EnforceBorderLines=true])

TA的精华主题

TA的得分主题

发表于 2021-4-30 17:31 | 显示全部楼层
deadzlq 发表于 2021-4-30 12:56
=Pdf.Tables(File.Contents(PathFile),[EnforceBorderLines=true])

谢谢大佬,我试了,但还是不能严格按照表格线划分PDF表格中的单元格内容

TA的精华主题

TA的得分主题

发表于 2021-5-17 14:14 | 显示全部楼层
PDF表格这方面确实是一个难题,我是先用word将pdf转为docx文件,然后手动复制表格到excel再进行其他处理,总之没有一劳永逸的方法的

TA的精华主题

TA的得分主题

发表于 2021-5-17 16:31 | 显示全部楼层
鉴于PDF的标准比较多,一般如果是Word格式的,我会VBA批量转存成PDF之后,以文件夹的方式PQ读取。PQ会对PDF内的表进行 抽取。当然效果也并不是百分百的。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-15 22:43 , Processed in 1.051618 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表