ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liucqa

[原创] 网页采集(网页提交)教程第一课-用XMLHTTP获取数据并用Adodb.Stream转换编码提取信息

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-16 10:52 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
本帖最后由 liucqa 于 2012-7-16 18:25 编辑
doryan 发表于 2012-7-16 10:16
期待 第二课
补充个字符串处理函数 StrConv
我喜欢用来把 BTYE数组 直接转换成 指定格式的字符串

加上了,不过我一般不用这个函数。因为只针对ANSI编码的网页才有效(简体版系统就是gb2312的网页)。

TA的精华主题

TA的得分主题

发表于 2012-7-16 11:15 | 显示全部楼层
本帖最后由 引子玄 于 2012-7-16 17:52 编辑
liucqa 发表于 2012-7-16 08:25
欢迎各位学习,请提出宝贵意见。如果有人能提供适合上课的网页链接,我会继续写教程


从初学者的角度,谈点自己的在学习中的困难感受,或许也是师者某节课的思考点。
网抓代码的通用性弱,因为网页千变万化。这是“难”之源泉。
听说网抓有四种方式:XMLHTTP对象、InternetExplorer对象、QueryTables对象、WebBrowser对象。其中QueryTables对象方法,是很多菜鸟最喜欢的手段,包括自己,也包括不少老外也在使用中求助此类问题。
因为QueryTables简单易学,即使有问题,处理起来也较为共性,感觉通用性好。至于导入部分的不同内容需求,擅长网页编辑的在源文件脚本中编辑处理,而擅长E技的则可以在E内处理,等等,可谓各显神通、各尽其长。
QueryTables对象方法,对单页面的处理,应该是很方便的。但是遇到多页面,对于初学者就感到棘手了。这棘手的障碍,主要是批量处理URL和多页面内容如何导进E内需要位置的问题。也就是如何处理代码写作中这“两个变量”的问题,即“如何做循环”?如果初学者掌握了这个难题的处理技巧,那么网抓学习者的潜力将被大大激发出来,原来“跳起来就摘到了桃子”。
希望在今后的学习中,能看到QueryTables对象法的“批量处理”技巧,让初学者捷足先登感受“成功快乐”。
以上纯属个人学习感受,不见得正确。
望大家赐教。

TA的精华主题

TA的得分主题

发表于 2012-7-16 12:15 | 显示全部楼层
本帖最后由 kangatang 于 2012-7-16 12:16 编辑

感谢liucqa 大侠,第一个较为系统化地讲解抓取工作流程和技巧。
我等网络方面的基础知识比较薄弱。对这种技巧缺少底层的知识。比如Cookie和sid的时效base64 encode, 以及decode;
还有cookie的工作原理,
各个post参数的什么时候必须用等等。

TA的精华主题

TA的得分主题

发表于 2012-7-16 13:04 | 显示全部楼层
各位路过的大侠,问一个问题:

如果碰上网址重定向。
GET 或POST 后面的网址是重定向前之前的,还是重定向之后的?(用重定向之后的网址肯定暂时没问题)

有时候连续重定向好几次。
重定向之后的网址不是每次都相同(里面的某些参数有时效,比如SID=.....等)
这样很麻烦。请问有什么办法?

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-16 14:28 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
kangatang 发表于 2012-7-16 13:04
各位路过的大侠,问一个问题:

如果碰上网址重定向。

用winhttp,get重定向之前的就行
.Option(6)=True

TA的精华主题

TA的得分主题

发表于 2012-7-16 15:37 | 显示全部楼层
liucqa 发表于 2012-7-16 14:28
用winhttp,get重定向之前的就行
.Option(6)=True

Option(6) 为 True 时,当请求页面重定向跳转时自动跳转;False 不自动跳转,并截取服务端返回的302状态

谢谢。到实际应用时,可能更复杂。

TA的精华主题

TA的得分主题

发表于 2012-7-16 17:11 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
貌似是不错的教程,不过还有其他的方法的

点评

再多说点  发表于 2012-7-16 17:41

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2012-7-16 19:43 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2012-7-16 20:38 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2012-7-16 20:51 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-23 17:01 , Processed in 0.042252 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表