|
可以用代码批量修改,因为文本识别本身就有很多错的,还是需要手动校对,用WPS2022打开使用
另外WPS会员有PDF和图片转文字的功能,可能比写代码校对效果更好
- function test() {
- let doc = ActiveDocument,
- str = doc.Content.Text,
- arr = str.match(/(?<=文】).*?(?=【校)/gms),
- brr = str.match(/(?<=注】).*?(?=【)/gms)
- arr.forEach(i => {
- let j = 0
- let s = i.replace(/\s|\n|\t|\r|[a-zA-Z]/g, '')
- s = s.replace(/[^\u4e00-\u9fa5,、。“”]/g, e => {
- j++;
- return `(${j})`
- })
- str = str.replace(i, `\n\n${s}\n\n`)
- })
- brr.forEach(i => {
- let j = 0,
- s = i.replace(/^\r|\r$/g, ''),
- crr = s.split('\r'),
- drr = []
- crr.forEach(i => {
- drr.push(i.replace(/^[^\u4e00-\u9fa5,、。“”]/, e => {
- j++;
- return `(${j})`
- }))
- })
- str = str.replace(i, `\n${drr.join('\n')}\n`)
- })
- doc.Content.Text = str
- }
复制代码 |
|