ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3142|回复: 11

[求助] 如何把文库内容一页一页的复制到word中

[复制链接]

TA的精华主题

TA的得分主题

发表于 2017-3-5 07:47 | 显示全部楼层 |阅读模式
本帖最后由 leedun 于 2017-3-5 09:11 编辑

举个例子:https://wapwenku.baidu.com/view/73af3a3a3968011ca30091a2?pn=1&pu=
pn=1是第一页,页码共有14页。
我想把文库绿色底纹的内容按顺序一页一页的复制到word中,哪位前辈能帮忙写个宏?
万分感谢!!


TA的精华主题

TA的得分主题

发表于 2017-3-5 08:57 | 显示全部楼层
才14页,手工复制一下也才二三分钟。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-3-5 09:14 | 显示全部楼层
jiminyanyan 发表于 2017-3-5 08:57
才14页,手工复制一下也才二三分钟。

前辈好,我在这里就是举个例子,以后还有很多需要文库文档,有的文档能有三四百页,所以来求助各位前辈,望能指教!

TA的精华主题

TA的得分主题

发表于 2017-3-5 12:55 | 显示全部楼层
简单粗暴的写了一个》》》》》》》》》》》》》》》》》》》》》》》
  1. Sub shishi()
  2.     Dim strText$, thm As Object, reg As Object, mt, mh, S$, K$
  3.     Set thm = CreateObject("msxml2.xmlhttp")
  4.     For i = 1 To 14
  5.         thm.Open "GET", "https://wapwenku.baidu.com/view/73af3a3a3968011ca30091a2?pn=" & i & "&pu=%20%20pn=1", False
  6.         thm.send
  7.         strText = strText & thm.responseText
  8.     Next
  9.     With CreateObject("VBScript.Regexp")
  10.         .Global = True
  11.         .Pattern = "<div class=""content bgcolor1"">([\s\S]+?)</div>"
  12.         For Each mt In .Execute(strText)
  13.             S = S & mt.submatches(0)
  14.         Next
  15.         .Pattern = "<p class=""txt"">([\s\S]+?)</p>"
  16.         For Each mh In .Execute(S)
  17.             K = K & mh.submatches(0) & vbCr
  18.         Next
  19.     End With
  20.     ActiveDocument.Content.Text = K
  21. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2017-3-5 12:57 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-3-6 08:19 | 显示全部楼层
duquancai 发表于 2017-3-5 12:55
简单粗暴的写了一个》》》》》》》》》》》》》》》》》》》》》》》

就喜欢这样的粗暴,感谢杜老师再次出手相助,解决了我一个大麻烦!

TA的精华主题

TA的得分主题

发表于 2017-3-6 16:42 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
duquancai 发表于 2017-3-5 12:55
简单粗暴的写了一个》》》》》》》》》》》》》》》》》》》》》》》

杜前辈好!
该代码适不适用复制“百度文库”上其它类似网页的内容?
如这个网址:https://wapwenku.baidu.com/view/e9da57d0d15abe23482f4d67?pu=%20%20pn=1
要怎样修改才可?劳前辈赐教,谢谢!

TA的精华主题

TA的得分主题

发表于 2017-3-6 17:34 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-3-8 11:06 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
13907933959 发表于 2017-3-6 16:42
杜前辈好!
该代码适不适用复制“百度文库”上其它类似网页的内容?
如这个网址:https://wapwenku.bai ...

几乎就是一样的,还是简单粗暴的写一下吧:

Sub shishi()
    Dim strText$, thm As Object, reg As Object, mt, mh, S$, K$
    Set thm = CreateObject("msxml2.xmlhttp")
    For i = 1 To 21
        thm.Open "GET", "https://wapwenku.baidu.com/view/e9da57d0d15abe23482f4d67?pn=" & i & "&pu=++pn%3D5", False
        thm.send
        strText = strText & thm.responseText
    Next
    With CreateObject("VBScript.Regexp")
        .Global = True
        .Pattern = "<div class=""content bgcolor1"">([\s\S]+?)</div>"
        For Each mt In .Execute(strText)
            S = S & mt.submatches(0)
        Next
        .Pattern = "<p class=""txt"">([\s\S]+?)</p>"
        For Each mh In .Execute(S)
            K = K & mh.submatches(0) & vbCr
        Next
    End With
    ActiveDocument.Content.Text = K
End Sub

TA的精华主题

TA的得分主题

发表于 2017-3-8 12:10 | 显示全部楼层
本帖最后由 13907933959 于 2017-3-9 07:58 编辑
duquancai 发表于 2017-3-8 11:06
几乎就是一样的,还是简单粗暴的写一下吧:

Sub shishi()

杜前辈好!
代码测试OK!感谢前辈!
代码可通用,前辈知道我是个莱鸟,不知网址的这个后面的一段 " & i & "&pu=++pn%3D5" 根据不同的网址,
不同页数文章(只大概知道这个 For I = 1 To 14 是1至14页的意思要具体怎样变化,能否再恳请前辈赐教?谢谢!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-13 08:07 , Processed in 0.045166 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表