ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 760|回复: 5

[求助] PQ数据清洗 多列一维表转二维表

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-6-6 17:37 | 显示全部楼层 |阅读模式
本帖最后由 unlast 于 2023-6-6 17:51 编辑

      就职一家通信工程公司,公司需要采集汇总所有光缆的OTDR的测试数据。OTDR测试报告为PDF(非图片版)每页为一条光缆,格式见下图。
1.png
    最终需要整理成如下格式
2.png



      个人不会VB编程,PQ高级功能也不会。
      全网查询找到两个方法,都需要先转换成WORD,再把每一页分一个文件……处理效果不理想。
          1、通过WPS的“文字排版-批量汇总表格” 该方法不能获取到文件名和非表格内的数据。
          2、利用word精灵关键字定位提取数据。提取出的数据比较完整,但有很多非空字符需要处理。   
     以上方法都需要先把PDF转换成word,然后把文件按页拆分单个文档,步骤麻烦。
     我发现excel自带的PQ能处理文字版的PDF文件,个人尝试了一下,遇到下面问题了。

图片.png

       1、文件名是单独一行   ,如何提取出并添加到对应数据前。
       2、有多列项目和值,如何合并成一列。

附件.zip

220.42 KB, 下载次数: 37

TA的精华主题

TA的得分主题

发表于 2023-6-6 21:33 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-6-6 21:44 来自手机 | 显示全部楼层
create temp table aa as
select fillna(iif(instr(F_D,'OTDR')>0,rowid,''))  grp,*,iif(regexp('1 \(\d\)',F_D),F_D,'')
fa,iif(F_A like '距离范围:',F_B,'') 距离范围, iif(F_A like '折射率:',F_B,'') 折射率
from 正则表达式数据清洗多行转一行 where rowid>1;
select grp,group_concat(fa,''),group_concat(距离范围,'') 距离范围,group_concat(折射率,'') 折射率  from aa group by grp;


Screenshot_2023-06-06-21-43-36-101_cn.uujian.browser.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-6-7 09:11 | 显示全部楼层
zpy2 发表于 2023-6-6 21:44
create temp table aa as
select fillna(iif(instr(F_D,'OTDR')>0,rowid,''))  grp,*,iif(regexp('1 \(\d ...

谢谢大佬,我试一下。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-6-7 09:12 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-8-20 17:34 | 显示全部楼层
见附件,清洗/拆分表

结果.zip

20.48 KB, 下载次数: 14

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-29 02:36 , Processed in 0.048216 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表