ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3281|回复: 48

[求助] 把杂乱无章的符号及带圈序号按顺序排列

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-4-26 10:08 | 显示全部楼层 |阅读模式
本帖最后由 相见是缘8 于 2023-4-26 10:10 编辑

要求1:

从文档内,每个【原文】至【校注】止,原文段落中,有 ◎ © ®@ ㉖ ^ % 这些杂乱无章的符号,及1~50的带圈序号(见下图1、图2),把它们全部从原文中有第一个符号或序号开始,依次按顺序替换为①②③④……,(见下图3、图4)。

要求2:

从文档内,每个【校注】至【理论阐释】止,每条校注的段落开头,有 ◎ © ® @ ㉖ 这些杂乱无章的符号,及1~50的带圈序号,或无序号的(见下图5、图6),把它们全部从校注的第一条的段落开头开始,依次把每条按顺序替换为①、②、③、④、……,(见下图7、图8)。


求老师们帮忙,写1个或2个代码,详情请看附件,谢谢!


如超过20以上的带圈序号,不显示,可把 “Numbers” 这个(1~99的带圈序号)字体文件,复制粘贴进电脑C盘 →“WINDOWS”→“Fonts”的文件夹内(即:“字体”文件夹),重启电脑,即可显示。

图1.png
图2.png
图3.png
图4.png
图5.png
图6.png
图7.png
图8.png

附件.rar

51.02 KB, 下载次数: 20

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-27 09:51 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-29 09:43 | 显示全部楼层
是高手未上线,还是这个替换太难呢?

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-1 08:40 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
各位老师!

要求1:
其实也就是把每个【原文】至【校注】止,原文各段落中,有 ◎ © ® @ ㉖ ^ % 这些杂乱无章的符号,及1~50的带圈序号,统一替换为一个符号,如★,再把它们全部从原文中有第一个★开始,依次按顺序替换为①②③④……。

要求2:
其实也就是把每个【校注】至【理论阐释】止,每条校注的段落开头,有 ◎ © ® @ ㉖ 这些杂乱无章的符号,及1~50的带圈序号,或无序号的,统一替换为一个符号,如▲,再把它们全部从校注的第一条的段落开头的▲开始,依次把每个▲按顺序替换为①、②、③、④、……。

求会的老师帮忙,谢谢!

TA的精华主题

TA的得分主题

发表于 2023-5-1 10:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
可能有些地方不能分开吧。如原文中 上頤循面人目。请问你是如何智能分开成  上颐②,循面入目。

TA的精华主题

TA的得分主题

发表于 2023-5-1 11:50 | 显示全部楼层
本帖最后由 batmanbbs 于 2023-5-1 13:17 编辑
tcdatongye 发表于 2023-5-1 10:50
可能有些地方不能分开吧。如原文中 上頤循面人目。请问你是如何智能分开成  上颐②,循面入目。

楼主是"懒"得过了头。排版向来都是最后一道工序,OCR的错误太多,至少应该把文档中的错别字、错误标点和需要添注释的位置都处理完了,然后再谈排版的问题。这种到处是错误的文档,如何能排版。VBA再牛也不是万能的啊,何况不了解中医的普通人更加无法分辨这个文档的内容。
举个例子,文档中第一个原文,按照现在的乱码,可能只有22个注释,结果实际注释有37个,后期还得重新来过,这不是白排版了吗。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-1 18:17 | 显示全部楼层
tcdatongye 发表于 2023-5-1 10:50
可能有些地方不能分开吧。如原文中 上頤循面人目。请问你是如何智能分开成  上颐②,循面入目。

tcdatongye 老师,好!
感谢你回复!
我是根据原 PDF 文档 “分开” 的,其实也不是 “分开”,是此处有注释②
②、颐:位于面部两侧,口角外下方,颌的外上方,腮的前下方处。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-1 18:19 | 显示全部楼层
batmanbbs 发表于 2023-5-1 11:50
楼主是"懒"得过了头。排版向来都是最后一道工序,OCR的错误太多,至少应该把文档中的错别字、错误标点和 ...

batmanbbs老师,好!
感谢你回复!
我不是 “懒” !只是如你说的 OCR 的错误太多,注释的位置错误太多,如用手工纠错,太耗时了,我想这个注释位置的错误,用 VBA(或正则)是可以解决的,其它的文字及标点错误,肯定是我用手工逐个纠错。
你说[文档中第一个原文,按照现在的乱码,可能只有22个注释,结果实际注释有37个],这种况不是太多,绝大部分的注释位置处没有遗漏,只是被 ◎ © ® @ ㉖ ^ % 这些杂乱无章的符号,及 1~50 的带圈混乱序号替代了,所以想求会的老师,帮忙写个代码,解决注释位置的错误!

TA的精华主题

TA的得分主题

发表于 2023-5-1 23:24 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 batmanbbs 于 2023-5-2 08:27 编辑

修改了一下,看11楼,其中第13句和第48句可以控制过滤的乱码
第13句是过滤【原文】的,其中"|"之前"[]"之间的内容是需要去掉的乱码,之后"[]"之间的是需要保留的字符

TA的精华主题

TA的得分主题

发表于 2023-5-1 23:38 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 batmanbbs 于 2023-5-2 08:29 编辑

注意:
一是【】中内容一定要相符,比如你的文档第一个"【原文】"写的是"【愿文】",不会被识别,所以修改错别字还是必须先做的;
二是必须安装你自己提供的字体。
BTW:谈不上什么老师,也是刚刚接触VBA,相互学习而已。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-27 04:05 , Processed in 0.042920 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表