ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖
楼主: 幽谷醉翁

[求助] 提取PDF文件中的表格

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-1-28 13:51 | 显示全部楼层
已提取,代码中的路径要改一下:
然后几个依赖根据提示pip install 一下就好了。
PixPin_2024-01-28_13-56-16.png

TA的精华主题

TA的得分主题

发表于 2024-2-5 09:08 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2024-4-1 10:43 | 显示全部楼层
  1. import pdfplumber
  2. import pandas as pd

  3. pdf = pdfplumber.open("华升明细1.pdf")

  4. pages = pdf.pages
  5. if len(pages)>1:
  6.     tables=[]
  7.     for each in pages:
  8.        table = each.extract_table()
  9.        tables.extend(table)
  10. else:
  11.     tables=each.extract_table()
  12. data = pd.DataFrame(tables[1:], columns=tables[0])
  13. data.to_excel("华升明细1.xlsx", index=False)
复制代码
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-4 01:20 , Processed in 0.038087 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表