ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3409|回复: 5

[求助]如何批量粘贴网页内容??

[复制链接]

TA的精华主题

TA的得分主题

发表于 2005-12-23 11:03 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
经常在网上看到一篇好的文章连载想一次性粘贴下来,,如 http://book.sina.com.cn/nzt/his/zXXX/1.shtml http://book.sina.com.cn/nzt/his/zXXX/2.shtml http://book.sina.com.cn/nzt/his/zXXX/3.shtml http://book.sina.com.cn/nzt/his/zXXX/4.shtml 要是一个一个网页打然后全选--复制--WORD--粘贴,好麻烦,有没什么更好的办法啊??

TA的精华主题

TA的得分主题

发表于 2005-12-23 11:38 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

这个呀,办法不是太多。

页面的地址很规律的,可以用下载软件试试,譬如只改1、2、3、4就可以下载了。

TA的精华主题

TA的得分主题

发表于 2005-12-23 11:43 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2005-12-23 14:07 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
以下是引用[I]gues1688[/I]在2005-12-23 11:43:51的发言:[BR]用宏可以实现
HOW????多谢老大

TA的精华主题

TA的得分主题

发表于 2005-12-24 13:53 | 显示全部楼层

用许多办法可以实现,下面的代码,针对新浪读书网,过滤了前面、后面许多无用的文字:

Option Explicit
Function bytes2BSTR(vIn)
Dim strReturn, i, ThisCharCode, innerCode, Hight8, Low8, NextCharCode
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn, i, 1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn, i + 1, 1))
strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function
Function viewHtmlCode(url)
Dim baoxmlhttp As Object
Set baoxmlhttp = CreateObject("Msxml2.xmlhttp")
With baoxmlhttp
.Open "GET", url, False, "", ""
.Send
viewHtmlCode = bytes2BSTR(.ResponseBody)
End With
Set baoxmlhttp = Nothing
End Function
Function stripHTML(strHTML)
Dim objRegExp As Object, strOutput$
Set objRegExp = CreateObject("vbscript.RegExp")
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<(.|\n)+?>"
strHTML = VBA.Replace(strHTML, "<p>", vbCr)
strOutput = objRegExp.Replace(strHTML, "")
strOutput = Replace(strOutput, "<", "<")
strOutput = Replace(strOutput, ">", ">")
strOutput = Replace(strOutput, vbCr & vbCr, vbCr)
strOutput = Replace(strOutput, "nbsp;", "")
stripHTML = strOutput
Set objRegExp = Nothing
End Function

Function copyHtmlText(url As String) As String
Dim SourceStr$, pStart#, pEnd#, strLen#
SourceStr = viewHtmlCode(url) '网页的代码
pStart = VBA.InStr(1, SourceStr, "<div id=article>", vbTextCompare)
pEnd = VBA.InStr(1, SourceStr, "发表评论", vbTextCompare)
strLen = VBA.Len(SourceStr)
SourceStr = VBA.Mid$(SourceStr, pStart, pEnd - pStart)
copyHtmlText = stripHTML(SourceStr)
End Function

Sub getText()
Dim url As String
With Selection
url = "http://book.sina.com.cn/nzt/his/maozedongjuece/1.shtml"
.EndKey unit:=wdStory, Extend:=wdMove
.Text = copyHtmlText(url)

url = "http://book.sina.com.cn/nzt/his/maozedongjuece/2.shtml"
.EndKey unit:=wdStory, Extend:=wdMove
.Text = copyHtmlText(url)

url = "http://book.sina.com.cn/nzt/his/maozedongjuece/3.shtml"
.EndKey unit:=wdStory, Extend:=wdMove
.Text = copyHtmlText(url)
End With
End Sub

TA的精华主题

TA的得分主题

发表于 2005-12-24 14:09 | 显示全部楼层

把最后一个代码改成如下,就把我的代码示例中连载的45篇文章全部自动写入文档了。

写入后,可以用word进行进一步处理。

Sub getText()
Dim url As String, i As Integer
With Selection
For i = 1 To 45
url = "http://book.sina.com.cn/nzt/his/maozedongjuece/" & i & ".shtml"
.EndKey unit:=wdStory, Extend:=wdMove
.Text = copyHtmlText(url)
Next
End With
End Sub

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 03:30 , Processed in 0.031359 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表