老大,如不是您的提醒,我将成为最笨的傻瓜。
由于一直认为WROD的“寻找与替换”所支持的'规则表达式'仅仅限于^p,^l,^?等有限的几个(一直没去关注那个几乎天天打照面的“使用通配符”选择框),因此一直在寻找第三方文字编辑软件,可由于都没真正的进行过本土化处理,使用中都存在这样那样的不便与BUG。现在看来,这些东东比起MS那成千上万的聪明脑袋所生产的OFFICE套件,毕竟是“小儿科”。
开始我有些奇怪,版主怎么对我在第二次上网时提出的那个“三内容定位”程序忽略不谈,可回到家,按老大的提示,按下了那个“该死”(不是他该死,是我该死)的“使用通配符”选择框,眼前顿时一亮,熟悉的*(代替任意多字符)[](代替区间内的字符)立马使我感到在过去的数年中,我的心血很大程度上被浪费了(我找很多第三方软件其实除了不稳定的高速外,很大程度上是为了有这几个通配符),怪谁,还得怪我自己。
但我早就说过,我来这儿会给您带来数不清的问题,这一次,仍是关于查找与替换的问题,具体内容见附件,这次要删除文本中所有的小标题,而几乎无规律可循,仅有如下特性:
1、以四个半角空格作为段首;
2、每个(欲删除)段落中有个“第”字;
3、在(欲删除)段落的尾部有很长一串半角空格;
我按照您上次提供的方法,仍是三步曲,先将所有段落标记改为手工分行符,再用
(四个半角空格)+“*”+“第”+“*”+(十来个半角空格)+"^l"作为寻找内容,至于试验结果,请您亲自动手试试!
进一步试验,
1.如将表达式改为(四个半角空格)“*”+(十来个半角空格)+"^l" ,则将所有空行附带删除,这虽然不影响大局,但那毕竟不是我的初始要求。
2.若将段尾上的那一串空格先行变为一个特怔字符(如AAAA),然后用
(四个半角空格)+“*”+“第”+“*”+"AAAA"+"*"+"^l"
则结果是陷入死循环。
由于我用同样的思路在Ultraedit中解决了这个问题,我认为这是由于WROD对多重“*”通配符的处理速度较慢引起的(抑或是WORD根本就不支持在表达式中重复使用通配符)?版主以为然否,抑或是我的代码有误?
如真如我所想,那我的那个“三内容定位查找”程序尚有动手一试的必要,您能给我个思路么(目的就查找在头、尾、中部各有三个特怔字符的文本内容,即能定位又可纠错),我去做了再请您修改,不多费您时间,何如?
ahXkAfJf.rar
(9.22 KB, 下载次数: 11)
|