|
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件 ★ 免费下载 ★ ★ 使用帮助★
在论坛中有较多的关于使用post实现网页数据的抓取技术了。
但在所有的语言中均去除了HTML特有的一些语言结构。导致部分使用固定几个图片的示意的数据无法获取。
ccwan大大此前的语言代码
Sub cc() Cells.ClearContents Set oDoc = CreateObject("htmlfile") With CreateObject("WinHttp.WinHttpRequest.5.1") .Open "GET", "http://www.cde.org.cn/transparent.do?method=spxlList&tasktype=xb&nowYearM=2014-02&acceptid=&applyTypeCde=IND&isTimetag=0¤tPageNumber=1&pageMaxNumber=340&totalPageCount=17&pageroffset=20&pageMaxNum=20&pagenum=1", False .send .WaitForResponse oDoc.body.innerHTML = .responsetext Set r = oDoc.All.Tags("table")(7).Rows For i = 0 To r.Length - 1 For j = 0 To r(i).Cells.Length - 1 Cells(i + 1, j + 1) = r(i).Cells(j).innerText Next j Next i Set r = Nothing End WithEnd Sub
能将表格里的文字内容有效复制,但是灯泡处均指向链接<img src="/styles/images/lamp_shut.gif">则过滤掉了。
请教各位大大,如果面对这样的一种情况,如何编写合适的语言才能将<img src="/styles/images/lamp_shut.gif">这样的数据保留,以进行后期的判断?
|
|