ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 守柔

[原创] 守柔拼音居士-汉字拼音Word COM 加载项安装程序下载

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2009-3-14 09:12 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
原帖由 wjhere 于 2009-3-13 18:51 发表
在测试中感觉还有些小问题,斗胆再提两点建议,反正版主不烦就行。
1.制作成工具条的模样,可以通过菜单显示隐藏工具条即可,比较方便。
2.加强词库建设,例如多音字,是否有一个默认音,这个默认音符号两个标准: ...

To wjhere:
COM加载项在具体到WORD的接口中,实际上是有问题的,目前的COM加载项的代码尚且是我根据.NET改编的,一直没有找到最官方的代码。原因在于Word的窗口与Excel的窗口不同。相同的要求,在EXCEL中的COM实现方式要比Word中简单。深层的原因在于窗口打开方式的不同,Excel可以形象地看作一个应用程序打开一个或者多个工作薄,而Word则可以理解为一个应用程序打开一个文档。比如,通常我们知道,EXCEL中的自定义菜单方式保存在应用程序中的,而Word则可以保存在独立的文档中。它导致的直接后果就是Word在每一个文档中切换时,工具栏、菜单栏都会发生变化,COM加载项代码不同,将直接导致自定义的命令可见而不可用(精确的说只能在第一个文档窗口中有效),经过我的实践,当使用自定义工具栏时,极不稳定,而定义于菜单栏中的命令,则不会发生此问题。
而且,我一直以为,菜单/工具栏/工具的使用,每个人有不同的习惯,倘会在Word中自定义工具栏,则一切都简单的多,可以通过复制COM加载项菜单的方式,定义到自己的工具栏中,这个可靠更好一些。太多的工具栏,我现在倒反而有些不习惯了。
词库建议,说大也大,也简单也简单,但需要时间与精力,我个人认人,可以通过人工干预的方法,整理词库即可,调整高频次序。因为每次测试的文档不一样,WDPY.TXT词库我已多次调整了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2009-3-14 09:13 | 显示全部楼层
原帖由 wjhere 于 2009-3-13 19:29 发表
对版主提到的api动态菜单很有兴趣,不知是否方便学习一下具体代码,因为我正在做一个小com加载项,需要用到。

你可以百度一下,使用API生成右键菜单的VB代码,有现成的类,你可以据实修改一下。

TA的精华主题

TA的得分主题

发表于 2009-3-14 12:46 | 显示全部楼层
守柔兄,所说之事已在短信中回复,请查看。

TA的精华主题

TA的得分主题

 楼主| 发表于 2009-3-14 13:01 | 显示全部楼层
原帖由 guanlan 于 2009-3-14 12:46 发表
守柔兄,所说之事已在短信中回复,请查看。

谢谢guanlan兄。
论坛的短消息好象有些问题,您发给我的短消息,竟然在我的发件箱中,不可思议!
感谢guanlan兄!
另所提及的32000字,其实是来源于Word对于域的限制,按照WORD XP中的极限,一个文档中域的最多数量不得超过32000个,WORD 2003应该也一致,但已没有专门的官方限制,明确WORD中的极限了。

TA的精华主题

TA的得分主题

发表于 2009-3-14 13:12 | 显示全部楼层
附件中是我整理的常见儿化词列表(已按拼音居士格式注音)和常见多音词列表,请守柔兄看看有没有什么用处,能加入词库就加入,没有用或者不能加入就算了。
我自己试了一下,把上述儿化词加入词库后,标注过程中会出现出错提示(如图)。注音时有些能正确标示,有的不能,但并不影响标注结果,正确的就省得校对了,不正确的可以通过多音校对进行校对。不知道有没有别的影响,如果没有的话,感觉能够去掉那个出错提示就行了。
用拼音软件来给汉字标音的时候最大的难题就是轻声词、儿化词、多音词,上述问题解决了,轻声词、儿化词、多音词的标注问题就基本上都解决了。别的软件就没有什么可超越的了。
就拼音居士来说,轻声词的问题已经基本上解决了,儿化词现在已经有了解决的办法,所以要不要在词库中加入儿化词并不是非常重要,多音词可以通过多音字来解决,或许也可以单独解决吧,这个留给守柔兄思考了,呵呵。

WDPY.TXT词库中的词语,如果里边没有多音字的,应该是可以从词库中去掉的。我把词库中所有的词语都剪切出来,只留下单字,保存WDPY.TXT。然后把那些词语复制到word中让已经只有单字词库的拼音居士标注,凡是词语中没有被标识为红色的,说明该词语里没有多音的字,词库中有没有它都没关系,应该是可以删除的。不过词语数量实在太多,不可能一条条删除,我不知道如何能够批量删除,如果能够把这些词语删除掉的话,应该可以让“词库”“减肥”不少。

[ 本帖最后由 guanlan 于 2009-3-14 13:28 编辑 ]
未命名.JPG

常见多音词表.rar

12.26 KB, 下载次数: 15

常见儿化词表.rar

6.84 KB, 下载次数: 12

TA的精华主题

TA的得分主题

 楼主| 发表于 2009-3-14 13:24 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
原帖由 guanlan 于 2009-3-14 13:12 发表
这是常见儿化词列表(已按拼音居士格式注音)和常见多音词列表,请守柔兄看看有没有什么用处,能加入词库就加入,没有用或者不能加入就算了。
我自己试了一下,把上述儿化词加入词库后,标注过程中会出现出错提示( ...

谢谢guanlan兄!
我先解释一下,为什么我不把没有多音字的词组删除呢?
这里面有程序的需求,随便一个例子“我们”(不一定正确),如果是词组,程序只作一次查询,便可以获得拼音,而如果把“我们”这个词组从词库中删除,则程序需要作二次查询,这样,内存消耗反而大了;反之,如果是Word词组,而词库中没有时,其实是作了至少三次查询,先按词组查询,查询返回为空,再作单字循环查询(每字一次),所以这个其实存在的意义远比删除合适。
另外,目前的程序,词库再扩大一二倍基本没有影响,这是代码代化所决定的。
多音和轻声我再研究一下,有问题再请教。

TA的精华主题

TA的得分主题

发表于 2009-3-14 13:30 | 显示全部楼层
原帖由 守柔 于 2009-3-14 13:24 发表

谢谢guanlan兄!
我先解释一下,为什么我不把没有多音字的词组删除呢?
这里面有程序的需求,随便一个例子“我们”(不一定正确),如果是词组,程序只作一次查询,便可以获得拼音,而如果把“我们”这个词组从词 ...

谢谢!像这样的代码、编码之类的东东我是一窍不通。如此说来,我们确实没有必要把那些词语删除。

TA的精华主题

TA的得分主题

 楼主| 发表于 2009-3-14 17:04 | 显示全部楼层
原帖由 guanlan 于 2009-3-14 13:12 发表
附件中是我整理的常见儿化词列表(已按拼音居士格式注音)和常见多音词列表,请守柔兄看看有没有什么用处,能加入词库就加入,没有用或者不能加入就算了。
我自己试了一下,把上述儿化词加入词库后,标注过程中会出 ...

经过认真的思考,重新整理了guanlan兄提供的文档,在守柔拼音居士V2.4.5版本中,继承前一版本的思路,以更新WDPY.TXT词库为主,内置了51052条记录,其中词组30150个(含151个多音词,250个常见儿化词),汉字20902个。
多音词有部分有误,我已增删;儿化词组中,有一部分并非Word中文词组。
显式儿化音时一步到位;如果是多音词组的话,我仔细看了,真正意义上的多音并不多,三十一个,其余多为轻声,考虑到多音词组来源于多音字,只是作了颜色上的标识,若为前三十一个,可以通过多音校对面板处理,对于后者以轻声为主的,可以右键处理之。
请诸位到一楼下载最新守柔拼音居士安装程序测试之。

TA的精华主题

TA的得分主题

发表于 2009-3-14 18:44 | 显示全部楼层
现在用户恐怕只能来吹毛求疵了,呵呵。
发现词库中分别有两组“这儿、那儿、哪儿”,导致注音时被注为“ zhè er、 nǎ er、 nà er”,而且不显示为多音,会错过校正,正确的应该是“ zhèr、nàr、nǎr”,去掉词库中的“这儿|zhè er、哪儿|nǎ er、那儿|nà er”就可以了。

[ 本帖最后由 guanlan 于 2009-3-14 18:53 编辑 ]

TA的精华主题

TA的得分主题

发表于 2009-3-14 18:49 | 显示全部楼层
原帖由 守柔 于 2009-3-14 17:04 发表

经过认真的思考,重新整理了guanlan兄提供的文档,在守柔拼音居士V2.4.5版本中,继承前一版本的思路,以更新WDPY.TXT词库为主,内置了51052条记录,其中词组30150个(含151个多音词,250个常见儿化词),汉字20902 ...

多音词并非错误,我提供的那些都是多音多义的词语——念不同的音有不同的意义的词。
对这些词中念不同音的字,在WDPY.TXT词库中把它们设置为多音字就可以了,如果要直接按照多音词选择,恐怕就不怎么好处理。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-1 19:20 , Processed in 0.043438 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表