ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 329|回复: 1

[求助] 工作中要用到OFD格式的文件,想提取里面的内容,找到一个OFD的库,但是不太会用

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-2-2 08:37 | 显示全部楼层 |阅读模式
这个库的相关代码:库的名字叫easyofd,国人开发的,请pip install easyofd来安装。
网址:https://pypi.org/project/easyofd/
# @Version: 1.0
# @Author : 汤灏
# @File   : odfTest1.py
# @Time   : 2024/1/26 14:41
# read_ofd_text.py
import os
import sys

# 确保 easyofd 包可以被导入
sys.path.insert(0, os.getcwd())
sys.path.insert(0, "..")

# 导入 easyofd 的相关模块
from easyofd.parser_ofd import OFDParser

class OFD(object):
    def __init__(self):
        self.data = None

    def read(self, ofd_f, format="path"):
        if format == "path":
            with open(ofd_f, "rb") as f:
                ofd_data = f.read()
        else:
            raise ValueError("Format not supported: %s" % format)

        # 假设 OFDParser 类能够接受二进制数据,并且有一个方法能够提取文本
        self.parser = OFDParser(ofd_data)
        self.data = self.parser.get_text()

    def get_text(self):
        return self.data

# 使用 OFD 类读取 OFD 文件中的文本
if __name__ == "__main__":
    # OFD 文件路径
    ofd_file_path = '1.ofd'

    # 创建 OFD 类的实例
    ofd = OFD()

    # 读取 OFD 文件并提取文本
    ofd.read(ofd_file_path, format="path")

    # 获取提取的文本
    extracted_text = ofd.get_text()

    # 打印提取的文本
    print(extracted_text)



easyofd-0.1.1.2-py3-none-any.zip

35.71 KB, 下载次数: 3

TA的精华主题

TA的得分主题

发表于 2024-5-7 11:16 | 显示全部楼层
ofd文件可以通过解压的方式,分析里面的xml文件做数据提取整理的
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-21 20:17 , Processed in 0.038647 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表