ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 9418|回复: 19

怎样从word文档中提取数据字段

[复制链接]

TA的精华主题

TA的得分主题

发表于 2016-10-6 21:09 | 显示全部楼层 |阅读模式
本帖最后由 tjc5471 于 2016-10-6 21:43 编辑

有时候做完一个word文档有几百页,同样的数据可能在文档不同的地方出现十多次,有时候会出现数据前后不一致的情况。我想能不能把word中含有数据的字段(比如两个标点符号间包含有数据的一段话)提取到excel中,这样检查错误会更加快捷和彻底。不知道有哪位大侠能够做到,奉上附件(表格中的数据可以不进行提取)。

1.rar

10.52 KB, 下载次数: 153

TA的精华主题

TA的得分主题

发表于 2016-10-6 23:13 | 显示全部楼层
含有数据的字段(比如两个标点符号间包含有数据的一段话)提取到excel中

这话有诸多疑惑:1、“含有数据的字段”:“数据”具体指什么?2、“两个标点符号间包含有数据的一段话”:a、“两个标点符号间”:什么标点?中文标点还是英文标点?具体点;b、“含有数据”:是数字型数据吗?具体点;c、“一段话”:这个在word中,我可以理解为一个段落吗?(注意:段落的准确含义你是否理解透彻了?)

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-10-6 23:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 tjc5471 于 2016-10-6 23:38 编辑

是这么回事,“数据”具体指阿拉伯数字,“两个标点符号间包含有数据的一段话”比如:该站1959年设立,1959~1971年观测逐旬降水量,1972年起人工观测时段雨量,(:该站1959年设立,)这里是一句,在引号和逗号间;:、(,1959~1971年观测逐旬降水量,)这里是一句,在逗号和逗号等
也可以退而求其次,只要是一句话存在数字,提取包括这数字的前5后3个字符出来,基本上可以清楚这数字是什么内容了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-10-6 23:25 | 显示全部楼层
比如报告,论文,涉及的数字很多,有时候从其他一些文稿中拷贝过来,后期修改又有很多的数字要变化,因此核对数字的前后一致尤为重要。因此需要把有关数字及其含义提取出来进行核对。

TA的精华主题

TA的得分主题

发表于 2016-10-6 23:36 来自手机 | 显示全部楼层
tjc5471 发表于 2016-10-6 23:25
比如报告,论文,涉及的数字很多,有时候从其他一些文稿中拷贝过来,后期修改又有很多的数字要变化,因此核 ...


那你说标点符号有多少个种类?包含英文标点吗?

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-10-6 23:39 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 tjc5471 于 2016-10-6 23:41 编辑
duquancai 发表于 2016-10-6 23:36
那你说标点符号有多少个种类?包含英文标点吗?

也可以退而求其次,只要是一句话存在数字,提取包括这数字的前5后3个字符出来,基本上可以清楚这数字是什么内容了,因为所提取的字段只是用于数字的校核,不作其他用途。

TA的精华主题

TA的得分主题

发表于 2016-10-7 00:11 | 显示全部楼层
tjc5471 发表于 2016-10-6 23:39
也可以退而求其次,只要是一句话存在数字,提取包括这数字的前5后3个字符出来,基本上可以清楚这数字是什 ...
  1. Sub Word操控Excel()
  2.     Dim pa As Paragraph, myBook As Object, mysheet As Object
  3.     Dim RegMatch, n As Long, arrData(1 To 10000, 1 To 1)
  4.     Application.ScreenUpdating = False
  5.     With CreateObject("VBScript.Regexp")
  6.         .Global = True: .MultiLine = True
  7.         .Pattern = "(?:^|[,。?!:])([^,。?!:\r]*\d+[^,。?!:\r]*)"
  8.         For Each pa In ActiveDocument.Paragraphs
  9.             If Not pa.Range.Information(wdWithInTable) Then
  10.                 For Each RegMatch In .Execute(pa.Range.Text)
  11.                     n = n + 1
  12.                     arrData(n, 1) = RegMatch.submatches(0)
  13.                 Next
  14.             End If
  15.         Next
  16.     End With
  17.     With CreateObject("Excel.Application")
  18.         If Tasks.Exists("Microsoft Excel") = True Then Tasks("Microsoft Excel").Close
  19.         Set myBook = .Workbooks.Add: .Visible = True
  20.         Set mysheet = myBook.Worksheets("sheet1"): mysheet.Activate
  21.         mysheet.Range("a1").Resize(10000, 1) = arrData
  22.     End With
  23.     Set RegMatch = Nothing
  24.     Set myBook = Nothing: Set mysheet = Nothing
  25.     Application.ScreenUpdating = True
  26. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2016-10-7 00:16 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
tjc5471 发表于 2016-10-6 23:39
也可以退而求其次,只要是一句话存在数字,提取包括这数字的前5后3个字符出来,基本上可以清楚这数字是什 ...

打开附件,点击按钮提取》》》》》》》

1.rar

27.66 KB, 下载次数: 260

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-10-7 08:44 | 显示全部楼层
本帖最后由 tjc5471 于 2016-10-7 08:59 编辑

感谢duquancai兄,很不错,试了正在做的一个报告,一下子就发现有几个数字不一致的地方。虽然导出来的数据有些乱,比如只需要带单位的数据,比如立方、平方、km、万元、m等等,章节号可以不需要,但在excel可以删除的。
11.jpg

TA的精华主题

TA的得分主题

发表于 2016-10-7 09:38 来自手机 | 显示全部楼层
tjc5471 发表于 2016-10-7 08:44
感谢duquancai兄,很不错,试了正在做的一个报告,一下子就发现有几个数字不一致的地方。虽然导出来的数据 ...

数据有些乱吗?不是你要求标点之间只要有数字的内容吗?你之前可没有说明这些条件。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-12 21:55 , Processed in 0.025853 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表