ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2379|回复: 5

关于利用VBA程式处理电子书(2)-智能分段

[复制链接]

TA的精华主题

TA的得分主题

发表于 2005-6-6 16:33 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

在杂乱的电子书原稿中,最常见的情况是, A、一般段首存在二个全角空格, B、但有时文章中会插入一些诗词,而这些诗词的每行行首也有二个(或多个)全角空格; C、另外有一些文章中的评论、书信内容,这些段落的每一行同样会缩进二至多个空格。 而对这三者的处理方式是完全不同的,具体见下列样本,我的问题是:

1、红字显示的内容(即B内容)应该在处理完毕后仍保持原样(即行首空格不应该删除,或是全部删除但不能将行尾回车符删除),但是以兰色显示的部分的内容(即C内容)应该将行首空格与行间回车删除(除了段首空格与段间回车继续保留外)。而二者之间除了行尾标点的区别,似乎无法区分。如何一次性解决这两种不同类型的内容?

2、如果解决上述问题太麻烦,也可用查找方法先行定位,即将当前光标位置放在这种“可疑位置”(主要是有连续的二行以上的段首空格)处,以便人工分析,但如何作这个智能定位程式?

TA的精华主题

TA的得分主题

发表于 2005-6-6 16:44 | 显示全部楼层

这个想法不一定成熟:

假如说:

连续性的段落(段首有空格,并且长度基本差不多)的,根据段落结束(非空格)前的有无标点符号或者判断结束标点符号(是否为汉语结束性语句)来判断是否应该分段?

另外,步兵兄对电子书浸淫多时,可否有什么好的想法,不妨一并道来,让守柔借鉴一下?

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-6-6 17:06 | 显示全部楼层

守版主的想法完全与我一致。

对于A类电子书,只要用段首空格改成一个标记符号,到最后统一处理即可。

但对于B、C二类,我也觉得应该从行首、行尾两个方面来综合判断,如连续二行的行首都有空格,但行尾有结束标点的(我已用你提供的字符串去重程式与行尾字符提取程式收集了很多样本文件,结果最终确认,结束标点最多不过“,!)?:。 ”…’—”这不多的几种),就是B类,无结束标记的,就是C类。

但如何将这二个判断转化为程式,我就无能为力了。

如果程式太复杂,版主可在下周方便的时间再做,不急。

TA的精华主题

TA的得分主题

发表于 2005-6-15 07:39 | 显示全部楼层

步兵兄,今天不忙,就你的问题,沟通后予以较好解决。

请与我在MSN上联系。

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-6-15 10:53 | 显示全部楼层

那就先请老大提供以下二个程式:

一、查找连续的、段首有二个全角的“区域”,在进行人工处理后,能继续工作的程式。

二、利用段首两个全角空格与段尾结束型标点进行综合分析判断的程式。

难不难?

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-6-15 11:40 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-5 12:24 , Processed in 0.034625 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表