从某乎上copy一些很不错的回帖到word上,碰到两个问题:
1,涉及到图片的,上面会有一堆关于图片的link链接信息。
看看国家统计局的数据吧: <imgsrc="https://pic4.zhimg.com/50/v2-f67a8e587fe2f6667daea0709031adf8_hd.jpg?source=1940ef5c"data-caption="" data-size="normal"data-rawwidth="578" data-rawheight="164" data-default-watermark-src="https://pic1.zhimg.com/50/v2-b913da7640394f7a2886356a7f84d0fc_hd.jpg?source=1940ef5c"class="origin_image zh-lightbox-thumb" width="578"data-original="https://pic2.zhimg.com/v2-f67a8e587fe2f6667daea0709031adf8_r.jpg?source=1940ef5c"/>
2,每个帖子上面到了word上都有台头信息 作者:XXX,链接:XXXX,来源:XX, 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
能否通过批量替换去除掉? 谢谢。
|