ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖
楼主: 相见是缘8

[求助] 把杂乱无章的符号及带圈序号按顺序排列

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-5-1 09:04 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
这种 搞不来         

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-1 09:20 | 显示全部楼层

老师虽未帮上忙,能回复,帮顶一下,本人也感谢!

TA的精华主题

TA的得分主题

发表于 2023-5-1 19:46 | 显示全部楼层
你这个是用OCR识别的吧,简繁体混乱、标点符号错误,不管是行文还是段落都有问题,搞不了。。。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-1 20:05 来自手机 | 显示全部楼层
仙女配凡人 发表于 2023-5-1 19:46
你这个是用OCR识别的吧,简繁体混乱、标点符号错误,不管是行文还是段落都有问题,搞不了。。。

老师,好!
感谢你回复!
如你所说,是用 OCR 搞的,导致注释的位置错误太多,如用手工纠错,太耗时了,我想这个注释位置的错误,用 VBA(或正则)是可以解决的,其它的文字及标点错误,我再用手工逐个纠错。
注释位置处,被 ◎ © ® @ ㉖ ^ % 这些杂乱无章的符号,及 1~50 的带圈混乱序号替代了,所以想求会的老师,帮忙写个代码,解决注释位置的错误!

TA的精华主题

TA的得分主题

发表于 2023-5-1 23:30 | 显示全部楼层
可以用代码批量修改,因为文本识别本身就有很多错的,还是需要手动校对,用WPS2022打开使用
另外WPS会员有PDF和图片转文字的功能,可能比写代码校对效果更好
  1. function test() {
  2.   let doc = ActiveDocument,
  3.     str = doc.Content.Text,
  4.     arr = str.match(/(?<=文】).*?(?=【校)/gms),
  5.     brr = str.match(/(?<=注】).*?(?=【)/gms)

  6.   arr.forEach(i => {
  7.     let j = 0
  8.     let s = i.replace(/\s|\n|\t|\r|[a-zA-Z]/g, '')
  9.     s = s.replace(/[^\u4e00-\u9fa5,、。“”]/g, e => {
  10.       j++;
  11.       return `(${j})`
  12.     })
  13.     str = str.replace(i, `\n\n${s}\n\n`)
  14.   })

  15.   brr.forEach(i => {
  16.     let j = 0,
  17.       s = i.replace(/^\r|\r$/g, ''),
  18.       crr = s.split('\r'),
  19.       drr = []

  20.     crr.forEach(i => {
  21.       drr.push(i.replace(/^[^\u4e00-\u9fa5,、。“”]/, e => {
  22.         j++;
  23.         return `(${j})`
  24.       }))
  25.     })
  26.     str = str.replace(i, `\n${drr.join('\n')}\n`)
  27.   })

  28.   doc.Content.Text = str
  29. }
复制代码

测试附件WPS.zip

27.01 KB, 下载次数: 2

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-2 18:04 | 显示全部楼层
本帖最后由 相见是缘8 于 2023-5-3 06:51 编辑
仙女配凡人 发表于 2023-5-1 23:30
可以用代码批量修改,因为文本识别本身就有很多错的,还是需要手动校对,用WPS2022打开使用
另外WPS会员有 ...

老师,好!
感谢你的代码和提示!
可你提供的 “附件” 在我这打不开,代码粘贴进代码窗口,代码为红色,运行不了,这可能和我用的是公司的电脑有关,因公司的仓储软件帮定了 XP 系统,office 是 2003 版本的,不能升级和用别的。如升级和用别的,会导致公司的仓储软件用不了,如老板知道会炒了我!
老师,有不有办法,提供一个我电脑可用的代码?谢谢!

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-17 03:26 , Processed in 0.031127 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表