|
发表于 2022-4-25 10:20
来自手机
|
显示全部楼层
wtujcf123 发表于 2022-4-23 21:49
谢谢老师,我也在找寻通过word xml 里的节点进行提取的方法,谢谢老师。
写的非常好。
老师,您是在手 ...
<?php
function extract_tbl_frm_doc($document){
$out="";
//$document=file_get_contents("/storage/emulated/0/Download/求助-如何提出表格内容/求助-如何提出表格内容/document.xml");
/*
$patten="~<w:tbl>~";
$tbls=preg_split($patten,$document);
$table_two=$tbls[3];
*/
$patten="~<w:tr[^>]*>(.*?)</w:tr>~";
//preg_match_all($patten,$table_two,$matches);
preg_match_all($patten,$document,$matches);
$rows=$matches[1];
foreach($rows as $row){
$patten="~<w:t>(.*?)</w:t>~";
preg_match_all($patten,$row,$matches);
echo html_entity_decode(implode("\t",$matches[1])."\r\n");
$out.=html_entity_decode(implode("~",$matches[1])."\r\n");
$patten="~<w:t\s[^>]*>(.*?)</w:t>~";
preg_match_all($patten,$row,$matches);
echo html_entity_decode(implode("\t",$matches[1])."\r\n");
$out.=html_entity_decode(implode("~",$matches[1])."\r\n");
}
return $out;
}
/*
$document_file="/storage/emulated/0/Download/htdocs/ceshi/extract_doc/docx2/document.xml";
$document=file_get_contents($document_file);
$out=extract_tbl_frm_doc($document);
file_put_contents('输出.txt',$out);
*/
|
|