ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: onlycxb

[分享] 网页抓取分享

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-19 18:55 | 显示全部楼层
本帖最后由 onlycxb 于 2015-1-19 18:57 编辑

网抓分享:乐彩网
抓取排行榜及相关地址
  1. Sub 乐彩网()
  2.     Dim Url As String, Xml As Object, Html As Object, tb, lib
  3.     Dim i, j
  4.     Set Html = CreateObject("htmlfile")
  5.     Set Xml = CreateObject("MSXML2.XMLHTTP")
  6.     Url = "http://lebi.17500.cn/paihang/sort/rankDetail.php?flag=lianzhun&caizhong=3d&idx=wuma&type=1&typeid=0&days=7"
  7.     With Xml
  8.         .Open "GET", Url, False
  9.         .send
  10.         Html.body.innerhtml = Split(Split(.responseText, "<ul class=""listicon"">")(1), "</ul>")(0)
  11.     End With
  12.     Set tb = Html.all.tags("li")
  13.     For i = 0 To tb.Length - 1
  14.        If tb(i).classname = "" Then
  15.        Debug.Print tb(i).Children(1).innertext; "链接地址:" & tb(i).Children(1).href
  16.        End If
  17.     Next i
  18. End Sub
复制代码
输出
3D免费试前独胆连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=dudan&type=1&typeid=0&days=7
3D免费试前双胆连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shuangdan&type=1&typeid=0&days=7
3D免费试前三胆连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=sandan&type=1&typeid=0&days=7
3D免费试前杀一码连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shayima&type=1&typeid=0&days=7
3D免费试前杀二码连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shaliangma&type=1&typeid=0&days=7
3D免费试前杀三码连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shasanma&type=1&typeid=0&days=7
3D免费试前五码连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=wuma&type=1&typeid=0&days=7
3D免费试前六码连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=liuma&type=1&typeid=0&days=7
3D免费试前定位连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=dingwei&type=1&typeid=0&days=7
3D免费试前定和值连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shahewei&type=1&typeid=0&days=7
3D免费试前定跨度连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=shakuadu&type=1&typeid=0&days=7
3D免费试前组选连准排行榜链接地址:about:rankDetail.php?flag=lianzhun&caizhong=3d&idx=zuxuan&type=1&typeid=0&days=7

TA的精华主题

TA的得分主题

发表于 2015-1-19 22:38 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
太强大了,谢谢大师们的无私分享。

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-2-2 08:01 | 显示全部楼层
本帖最后由 onlycxb 于 2015-2-2 08:02 编辑
  1. Sub EH验证图形文字()
  2. Dim winhttp As New winhttp.WinHttpRequest
  3. Dim url As String, Strtxt As String
  4. url = "http://request.touclick.com/captcharequest.touclick?js=xsreSzhCehV7S2dQJhqQLPgprgAniQQppqNBDZZGQ1a6V4dzfc5mNwXzS8bWkdtq888h1QI60MXha4xpfVn1RVQaMuHbnClC0Czwb1caS5QiUaIsxUGEpn1Ce9j2OqScWWQyKBROtoGY9cGQ0uXtHg&b=44340233-68bc-4697-8799-f361556ecefc&c=0&t=1&s=&un=&ud=0&ran=" & Rnd()
  5. With winhttp
  6.    .Open "GET", url, False
  7.    .Send
  8.    Strtxt = Replace(Split(Split(.ResponseText, "[")(2), "]")(0), "'", "")
  9.    Debug.Print Strtxt
  10.    Debug.Print EnCodeByHTML(Strtxt)

  11. End With
  12. End Sub

  13. Function EnCodeByHTML(strText As String)
  14.     With CreateObject("htmlfile")
  15.         .write strText
  16.         EnCodeByHTML = .body.innertext
  17.     End With
  18. End Function


复制代码

TA的精华主题

TA的得分主题

发表于 2015-7-17 22:03 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
onlycxb 发表于 2014-10-14 07:57
分享2:抓取北京地铁1号线站名及换乘区间

url是在网页上怎样操作后抓的真实地址? 在fiddler里没找到这个url

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-7-18 22:23 | 显示全部楼层
exceltovba 发表于 2015-7-17 22:03
url是在网页上怎样操作后抓的真实地址? 在fiddler里没找到这个url

仔细找找,一定有的。

TA的精华主题

TA的得分主题

发表于 2015-9-18 15:11 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
onlycxb 发表于 2014-10-14 07:57
分享2:抓取北京地铁1号线站名及换乘区间

抓取站名和换乘区间: 真实地址是这样获取的, 找了好长时间没找到. 搜狗截图20150918150926.jpg
搜狗截图20150918150952.jpg

TA的精华主题

TA的得分主题

发表于 2015-9-18 16:50 | 显示全部楼层
exceltovba 发表于 2015-9-18 15:11
抓取站名和换乘区间: 真实地址是这样获取的, 找了好长时间没找到.

原因找到了, 是参数的顺序不一样了.

TA的精华主题

TA的得分主题

发表于 2015-9-18 20:02 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
onlycxb 发表于 2014-11-5 21:14
天气网定制温度
'网址防盗,json数据responsetext:
var cityDZ101281801 ={"weatherinfo":{"city":"101281 ...

复制你的代码运行, 运行到.send时卡住, 过一会儿就报错,  是什么原因?
error.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-9-18 23:09 | 显示全部楼层
具体是哪段代码,看看是否需要前期绑定组件?或者有的网页已经变化

TA的精华主题

TA的得分主题

发表于 2015-9-19 00:31 | 显示全部楼层
onlycxb 发表于 2015-9-18 23:09
具体是哪段代码,看看是否需要前期绑定组件?或者有的网页已经变化

搜狗截图20150919003118.jpg
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-12 03:05 , Processed in 0.026871 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表