|
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件 ★ 免费下载 ★ ★ 使用帮助★
- import fitz # PyMuPDF
- # 打开原始PDF文件
- doc = fitz.open("文件名.pdf")
- # 定义要搜索的关键词列表
- keywords = ["关键字1", "关键字2", "关键字3"]
- # 存储包含关键词的页面索引
- pages_to_copy = []
- for page_num in range(len(doc)):
- page = doc.load_page(page_num)
- text = page.get_text("text")
- # 将文本转换为小写,以便不区分大小写地搜索
- text_lower = text.lower()
- for keyword in keywords:
- if keyword.lower() in text_lower:
- pages_to_copy.append(page_num)
- break # 一旦找到一个关键词,就不再检查其他关键词
- # 创建一个新的PDF文档
- new_doc = fitz.open()
- for page_num in pages_to_copy:
- # 将页面插入到新文档中
- new_doc.insert_pdf(doc, from_page=page_num, to_page=page_num)
- # 保存新的PDF文件
- new_doc.save("filtered_document.pdf")
复制代码 |
|