ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2321|回复: 9

扫描处理word文档,

[复制链接]

TA的精华主题

TA的得分主题

发表于 2005-8-11 21:03 | 显示全部楼层 |阅读模式

在标准文档中,

1 每个数据有7项 (不包括标题,每个标题前有标号).

(项目名分别为:Official Symbol, Name, Other Aliases, Other Designations, Chromosome, Location, GeneID)

2 在原数据中Name项通常在Official Symbol中.处理时去掉and另起一行

3 在原数据中有些项是缺失的,处理时用空行代替.(见标准文档)

4 在例文档中的最后一项比较特殊,见标准文档中的处理.

另,如果不编程,处理Name项和Location项比较容易,用P^替代and,用P^Location替代Location,但是项缺失用空行代替我就不会了.望斑竹帮忙.

呵呵,我已经急晕了,谢谢斑竹.

fMkoqc2u.rar (4.44 KB, 下载次数: 16)

[此贴子已经被作者于2005-8-12 11:13:07编辑过]

tkmd3Yl5.rar

3.55 KB, 下载次数: 19

扫描处理word文档,

7j4HYZiA.rar

4.44 KB, 下载次数: 9

扫描处理word文档,

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-8-11 22:38 | 显示全部楼层
各位帮帮我呀,谢谢了.

TA的精华主题

TA的得分主题

发表于 2005-8-12 07:22 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
以下是引用ying在2005-8-11 22:38:22的发言: 各位帮帮我呀,谢谢了.

请楼主认真作好以下工作:

一:将你的标准答案,另附一个文档上传;

二:将你在平时处理中需要注意或者可能出现的情况例举出来;

三:注意表达清楚你的要求:行与段落是完全不同的概念!

四:“但这些数据不太规范,有些数据缺了几项(如3项), 这3项分别是由"and"和两个"Other"起头”,这句话怎么理解?请举个实例。

五:扫描所有数据,将所有缺项的数据中,在缺项处加上空行.(段落标记吧?),在上方还是下方?

六:如果你做到以上几点了,可能不一定用编程也许查找与替换即可解决。

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-8-12 10:01 | 显示全部楼层
先谢谢了,标准文档已经上传到,另一话题了.

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-8-12 10:16 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

另外,请教一下:

1 如何判定一个段落的开头是数字字符构成?

2 在 一个段落前或后,加一个段落标记,实际上就是加了一个空行吧?word中空行不是一个空段落吗?

TA的精华主题

TA的得分主题

发表于 2005-8-12 11:38 | 显示全部楼层

楼主:

1、可以用^#的形式的通配符来表示数字,因此,你的“如何判定一个段落的开头是数字字符构成?”可以用^p^#来进行判断。

2、段落标记的确是指狭义空行(没有空格、制表符的“纯”空行),你的理解无误。

3、如果你的要求不是太急,我真想试试。跟老大学了这么多文字处理方面的VBA,还没为坛友们作过贡献,真是惭愧。

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-8-12 12:56 | 显示全部楼层

你能帮帮我,我是求之不得,先谢谢你.

TA的精华主题

TA的得分主题

发表于 2005-8-12 19:20 | 显示全部楼层

由于楼主的文档1中的有空白段落,即所有的Links 后的段落为一个空白段落,以下代码供参考:

'* +++++++++++++++++++++++++++++ '* Created By I Love You_Word!@ExcelHome 2005-8-12 19:20:54 '仅测试于System: Windows NT Word: 10.0 Language: 2052 '^The Code CopyIn [ThisDocument-ThisDocument]^' '* -----------------------------

Option Explicit Sub CheckPar() Dim MyKeyText() As Variant, CountPar As Byte, i As Paragraph '定义一个数组 MyKeyText() = Array("Official Symbol", "Name", "Other Aliases", "Other Designations", "Chromosome", "Location", "GeneID") On Error Resume Next Application.ScreenUpdating = False With ActiveDocument For Each i In .Paragraphs If VBA.InStr(i.Range, "Links") <> 0 Then For CountPar = 2 To 8 If VBA.InStr(i.Next(CountPar).Range, MyKeyText(CountPar - 2)) = 0 Then i.Next(CountPar).Range.InsertBefore Chr(13) End If Next End If Next End With Application.ScreenUpdating = True End Sub '----------------------

这是针对1.DOC运行的结果,最后一部分,好象有问题:

1: Baat Links

Official Symbol: Baat and Name: bile acid-Coenzyme A: amino acid N-acyltransferase [Rattus norvegicus]

Other Aliases: RGD:2190, MGC108728, kan-1

Other Designations: bile acid-Coenzyme A dehydrogenase: amino acid n-acyltransferase

Chromosome: 5; Location: 5q22

GeneID: 29725

2: Ddc Links

Other Aliases: RGD:2494, MGC93628

Other Designations: Dopa decarboxylase (aromatic L-amino acid decarboxylase); aromatic L-amino acid decarboxylase

Chromosome: 14; Location: 14q21

GeneID: 24311

3: Csad Links

Official Symbol: Csad and Name: cysteine sulfinic acid decarboxylase [Rattus norvegicus]

Other Aliases: RGD:621030

Other Designations: cysteine-sulfinate decarboxylase

Chromosome: 7;

GeneID: 60356

43: Srm Links

Official Symbol: Srm and Name: spermidine synthase [Rattus norvegicus]

Other Aliases: RGD:620796

Chromosome: 5; Location: 5q36

GeneID: 84596

44: Psat1 Links

Official Symbol: Psat1 and Name: phosphoserine aminotransferase 1 [Rattus norvegicus]

Other Aliases: RGD:735170, Psa1

Chromosome: 1; Location: 1q43

GeneID: 293820

45: Prpsap2 Links

Official Symbol: Prpsap2 and Name: phosphoribosyl pyrophosphate synthetase-associated protein 2 [Rattus norvegicus]

Other Aliases: RGD:620207, MGC93257, Pap41

Chromosome: 10; Location: 10q23

GeneID: 117272

47: Psph_predicted Links

Official Symbol: Psph_predicted and Name: phosphoserine phosphatase (predicted) [Rattus norvegicus]

Other Aliases: RGD:1308764, MGC109524, Psph

Chromosome: 12; Location: 12q13

GeneID: 304429

48: Rpl32 Links

Official Symbol: Rpl32 and Name: ribosomal protein L32 [Rattus norvegicus]

Other Aliases: RGD:621203, MGC72905

Chromosome: 6; Location: 6q33

GeneID: 28298

49: Cad Links

Official Symbol: Cad and Name: carbamyl phosphatate synthetase 2 [Rattus norvegicus]

Other Aliases: RGD:2251

Chromosome: 6; Location: 6q14

GeneID: 24240

50: Mte1 Links

Official Symbol: Mte1 and Name: mitochondrial acyl-CoA thioesterase 1 [Rattus norvegicus]

Other Aliases: RGD:621055

Chromosome: 6; Location: 6q31

GeneID: 192272

53: Ephx2 Links

Official Symbol: Ephx2 and Name: epoxide hydrolase 2, cytoplasmic [Rattus norvegicus]

Other Aliases: RGD:620732

Other Designations: cytosolic epoxide hydrolase

Chromosome: 15; Location: 15p12

GeneID: 65030

54: LOC501997 Links

similar to dehydrogenase/reductase member 2 [Rattus norvegicus]

Chromosome: 15; Location: 15p13

GeneID: 501997

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-8-12 20:55 | 显示全部楼层

非常感谢。两个if语句的条件,我看不懂,能注释一下吗?另外,能帮我看一下我在另一个贴子中的程序吗?其中关于range的一个用法有语法错误,您能帮我改一下吗?

TA的精华主题

TA的得分主题

发表于 2005-8-13 11:24 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
以下是引用ying在2005-8-12 20:55:20的发言:

非常感谢。两个if语句的条件,我看不懂,能注释一下吗?另外,能帮我看一下我在另一个贴子中的程序吗?其中关于range的一个用法有语法错误,您能帮我改一下吗?

我到底没弄明白,程序运行结果是否如楼主所想?

我希望楼主明示!谢谢。请不要一个问题尚未终结,又有新问题,好吗?饭得一口一口吃,程序得一个一个编。

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-15 13:01 , Processed in 0.042783 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表