ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1678|回复: 1

[讨论] 关于不同格式的多表汇总问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2010-9-19 13:11 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
你好,我的工作中经常遇到有很多个表,但每个表格式不是完全相同,想把这些表通过按一个按钮就汇总到一张总表里,如何用vba来实现?请高手指点。

表样.rar

10.46 KB, 下载次数: 16

要解决的工作表样

TA的精华主题

TA的得分主题

发表于 2023-4-4 18:38 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
https://zhuanlan.zhihu.com/p/619441131

抽取整合几千个布局不规范、表头名称不统一的非结构化Excel表格

1 问题描述:
审计项目中,需要合并,抽取,整合上万个表头和内容都不规范的非结构化Excel报价单文件。
抽取目标是包含产品名称,规格型号,价格等指定范围的近100个字段。要求抽取字段尽可能完整。


截取自 www.tablemerge.com

2 需求难点:
  • 布局不规范:每个Excel文件可能包含数十个Sheet(最多可能4-50个sheet),每个Sheet可能包含不固定位置,不固定表头的不固定表格(同一个表头字段可能有多种写法,例如产品名的表头可能有:产品名称,产品名,ProductName,名称,商品名,MeteralName等)。
  • 表头不统一:合并单元格表头、多栏、多行表头、表头顺序不一致、表头写法描述不一致
  • 内容不规范:同一个公司名、项目名、产品名、产品规格或属性有多种写法和描述方式
3 解决方案:
基于手工复制粘贴整理这些数据,几乎无法完成任务。
最终基于 tablemerge.com 非结构化文档结构化抽取模型,使用SQL语言,在数万个sheet上运行SQL抽取:
  • 自动识别复杂表头和行列:通过定制的SQL解析引擎和正则表达式解析引擎,在SQL中嵌入正则表达式实现抽取
  • 自动识别合并单元格、多栏、多行表头
  • 自动分析文档布局和版面,自动将文档分块和表格抽取
  • 一个SQL在上万个不规范的非结构化Excel文档上运行
  • 导出成结构化数据
4 开发流程:
只需三个步骤,将上万个不规范的非结构化Excel文档抽取成结构化数据,开发时只需写一个SQL,交给定制的非结构化SQL处理引擎。
开发人员只需熟悉SQL和正则表达式即可在上万个非结构化文档上进行预览、开发、跟踪调试、结果导出。
自动进行版面分析、表格区域分割和识别、合并单元格识别、多行多栏表头识别、结构化行列识别。
导出结构化数据到数据库或Excel。
最终只需要几天时间,就抽取整合出干净一致的数百万条数据表格,用于审计业务。

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-6 06:13 , Processed in 0.019477 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表