|
这个库的相关代码:库的名字叫easyofd,国人开发的,请pip install easyofd来安装。
网址:https://pypi.org/project/easyofd/
# @Version: 1.0
# @Author : 汤灏
# @File : odfTest1.py
# @Time : 2024/1/26 14:41
# read_ofd_text.py
import os
import sys
# 确保 easyofd 包可以被导入
sys.path.insert(0, os.getcwd())
sys.path.insert(0, "..")
# 导入 easyofd 的相关模块
from easyofd.parser_ofd import OFDParser
class OFD(object):
def __init__(self):
self.data = None
def read(self, ofd_f, format="path"):
if format == "path":
with open(ofd_f, "rb") as f:
ofd_data = f.read()
else:
raise ValueError("Format not supported: %s" % format)
# 假设 OFDParser 类能够接受二进制数据,并且有一个方法能够提取文本
self.parser = OFDParser(ofd_data)
self.data = self.parser.get_text()
def get_text(self):
return self.data
# 使用 OFD 类读取 OFD 文件中的文本
if __name__ == "__main__":
# OFD 文件路径
ofd_file_path = '1.ofd'
# 创建 OFD 类的实例
ofd = OFD()
# 读取 OFD 文件并提取文本
ofd.read(ofd_file_path, format="path")
# 获取提取的文本
extracted_text = ofd.get_text()
# 打印提取的文本
print(extracted_text)
|
|