ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4447|回复: 11

[求助] 关于网页数据抓取,为什么网页上能看到但是源码木有

[复制链接]

TA的精华主题

TA的得分主题

发表于 2014-10-24 10:59 | 显示全部楼层 |阅读模式
各位好,我在试着抓些房产数据,其他基本信息都能抓到,但是为什么如下图的那些数据网页上能看到,但是源码里面木有,这个要怎么抓取呀,求大神帮忙看下,谢谢
http://shanghai.anjuke.com/community/view/106  网页地址
QQ图片20141024105516.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-24 11:29 | 显示全部楼层
有木有遇到同样问题的兄弟呀

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-24 13:05 | 显示全部楼层
看来要沉了 刚试了下火狐的零时查看源代码 是可以看到的,但是get得不到数据

TA的精华主题

TA的得分主题

发表于 2014-10-24 15:15 | 显示全部楼层
顶一下,希望大神看见能讲解一下,我也遇到了这个问题

TA的精华主题

TA的得分主题

发表于 2014-10-24 15:32 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-24 15:33 | 显示全部楼层
刚在大神的帖子看到
2、IE/webbrowser法:
创建IE控件或webbrowser控件,结合htmlfile对象的方法和属性,模拟浏览器操作,获取浏览器页面的数据。
优点:这个方法可以模拟大部分的浏览器操作。所见即所得,浏览器能看到的数据就能用代码获取。
缺点:各种弹窗相当烦人,兼容性也确实是个很伤脑筋的问题。
不知还有其他方法?

TA的精华主题

TA的得分主题

发表于 2014-10-24 15:35 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
XMLHTTP 或 WINHTTP 我自己也學習中,初試還找不到你要的東西,等大神吧

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-29 14:26 | 显示全部楼层
还是我自己来 结贴吧   看到上面有个很火的大神贴  用fiddler查看了下网页包 ,发现这个未显示的数据还是从其他网页调用的  而且调用网站也在里面的  多搜索下http://shanghai.anjuke.com/v3/ajax/nearby/?commid=16655

TA的精华主题

TA的得分主题

发表于 2014-11-13 12:23 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 onlycxb 于 2014-11-13 12:53 编辑
snailzlf 发表于 2014-10-29 14:26
还是我自己来 结贴吧   看到上面有个很火的大神贴  用fiddler查看了下网页包 ,发现这个未显示的数据还是从 ...
  1. Sub test()
  2.     Dim DB, js
  3.      With CreateObject("MSXML2.XMLHTTP")
  4.         .Open "GET", "http://shanghai.anjuke.com/v3/ajax/nearby/?commid=106&cityid=11&callback=life_url_callback&J1415845726403 ", False
  5.         .Send
  6.     End With
  7.     Set js = CreateObject("scriptcontrol")
  8.     js.Language = "jscript"
  9.     js.addcode ("var dy=" & Split(w.ResponseText, "life_url_callback")(1))
  10.     Set DB = js.eval("dy.result")
  11.     Debug.Print CallByName(DB.school, "name", VbGet) & ":" _
  12.     & CallByName(DB.school, "distance", VbGet) / 1000 & "公里内学校,包括:" _
  13.     & CallByName(DB.school.attr, "nursery", VbGet) & "所幼儿园," _
  14.     & CallByName(DB.school.attr, "junior", VbGet) & "所小学," _
  15.     & CallByName(DB.school.attr, "middlel", VbGet) & "所中学"
  16.    
  17. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2014-11-13 12:29 | 显示全部楼层
本帖最后由 引子玄 于 2014-11-13 12:30 编辑

从理论上来说————这就牵涉到“源文件”(在浏览器)和“缓存文件”(在服务器)的问题了,源文件和缓存文件是两个不同的概念,以前我在网抓的帖子里,特意提到这个问题。楼主说的问题是——只看到浏览器的网页代码,没看到服务器的文件代码,如此问题罢了。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-6-18 19:54 , Processed in 0.042161 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表