ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: renahu

[分享] 小白也抓网——分享网抓作品

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-11-19 13:54 | 显示全部楼层
coby001 发表于 2014-11-19 09:23
ElseIf Timer - xhrArr(k, 2) > 30 Then
                            MsgBox "响 ...

如果加入人性好的提示,或者加入“重试”选项,无论是msgbo或自定义窗体,肯定都会阻断线程的是吗?

TA的精华主题

TA的得分主题

发表于 2014-11-19 14:11 | 显示全部楼层
renahu 发表于 2014-11-19 13:54
如果加入人性好的提示,或者加入“重试”选项,无论是msgbo或自定义窗体,肯定都会阻断线程的是吗?

你用一下迅雷的批量下载
看看迅雷是如何设置超时和重连次数的~
以及下载失败是如何显示
然后自己模拟一下~

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-11-19 14:18 | 显示全部楼层
coby001 发表于 2014-11-19 14:11
你用一下迅雷的批量下载
看看迅雷是如何设置超时和重连次数的~
以及下载失败是如何显示

各线程应该是独立的,互不影响的

TA的精华主题

TA的得分主题

发表于 2014-11-19 22:50 | 显示全部楼层
renahu   2014-11-19 22:30
我发现如果抓过一边,比如1到200页,如果再抓速度非常快,这一定是因为缓存的作用,即使我把程序关了,再查1到200页还是非常快,说明仍然用到缓存,如果我把excel也关了,再打开程序抓这比如1到200页,速度就慢了,看来只有关掉excel才能彻底清除缓存。有没有什么命令能达到这种清除缓存的目的?而不是关掉excel


在URL后加一段随机数即可~
http://club.excelhome.net/forum.php?mod=redirect&goto=findpost&ptid=1159783&pid=7921095

TA的精华主题

TA的得分主题

发表于 2014-11-19 23:23 | 显示全部楼层
renahu 发表于 2014-11-17 14:17
去掉那个引用后,把2003的重新转了一遍



不错,有进步,用了异步方式,速度快多了

缺点:用了太多的 msgbox,会令人厌烦的。

输入页数的方式要改进。
成功下载后,要提示下了多少条目录,多少页。

------
总体不错,细节需改进。

准备迎接下一个任务了哦~~

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-11-19 23:28 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
coby001 发表于 2014-11-19 23:23
不错,有进步,用了异步方式,速度快多了

缺点:用了太多的 msgbox,会令人厌烦的。

没用msgbox呀,我把他们都删了,超过时限就删除了,都没提醒,还有我提出的问题,就是断网后,在点击登录,要死很长时间怎么回事呀?

TA的精华主题

TA的得分主题

发表于 2014-11-20 11:35 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
renahu 发表于 2014-11-19 10:39
能不能再做个把网址所有字符都转成%24%30%40%。。。。,?网上的工具只能转汉字之类的,字母,数字都不转

这个问题现已经得到解决,详见吴姐的帖子第20楼及513楼):
不懂html也来学网抓(xmlhttp/winhttp+fiddler)

TA的精华主题

TA的得分主题

发表于 2014-11-20 11:42 | 显示全部楼层
VBA万岁 发表于 2014-11-20 11:35
这个问题现已经得到解决,详见吴姐的帖子第20楼及513楼):
不懂html也来学网抓(xmlhttp/winhttp+fiddl ...

以下test2代码可能有误——因为我没见过汉字的unicode码(即“\u”形式的编码),你能传一些汉字的unicode码上来测试吗?

Function GBKEnCode(strText)
    Dim i, s
    For i = 1 To Len(strText)
        s = Hex(Asc(Mid(strText, i, 1)))
        If Len(s) = 4 Then s = Left(s, 2) & "%" & Right(s, 2)
        GBKEnCode = GBKEnCode & "%" & s
    Next
End Function

Sub test2()
    MsgBox Replace(GBKEnCode("HTTP://www.apabi.com/ValidateCode.aspx的"), "%", "\u00")
End Sub

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-11-20 23:33 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
VBA万岁 发表于 2014-11-20 11:42
以下test2代码可能有误——因为我没见过汉字的unicode码(即“\u”形式的编码),你能传一些汉字的unicod ...

那就是:
  1. Function GBKEnCodeU(strText)
  2.     Dim i, s
  3.     For i = 1 To Len(strText)
  4.         s = Hex(Asc(Mid(strText, i, 1)))
  5.         If Len(s) = 4 Then s = Left(s, 2) & "\u00" & Right(s, 2)
  6.         GBKEnCodeU = GBKEnCodeU & "\u00" & s
  7.     Next
  8. End Function
复制代码

TA的精华主题

TA的得分主题

发表于 2014-11-21 08:57 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
renahu 发表于 2014-11-20 23:33
那就是:

我觉得第5句应改为:
s =IIf(Len(s) = 4, "", "00") & s

——汉字的unicode码应该不以"\u00"开头的,是吗?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 05:48 , Processed in 0.038154 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表