ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: tbjx138

[求助] 求大神帮忙写个网抓的代码

[复制链接]

TA的精华主题

TA的得分主题

发表于 2014-11-10 10:11 | 显示全部楼层
tbjx138 发表于 2014-11-10 09:24
renahu大神,我页数设置为10000,提取4000多条就报错了,不知道什么原因?

什么提示?太多了,会不会内存不够呀,提取4000条要多久呀,我没有试过大数据量

TA的精华主题

TA的得分主题

发表于 2014-11-10 10:18 | 显示全部楼层
renahu 发表于 2014-11-9 18:45
不知道有没有高手能解决验证码的问题

验证码不是那么好弄的,简单点的还好说,复杂的识别率低得可怜。。。。。。

TA的精华主题

TA的得分主题

发表于 2014-11-10 10:34 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 renahu 于 2014-11-10 10:38 编辑
tbjx138 发表于 2014-11-10 09:24
renahu大神,我页数设置为10000,提取4000多条就报错了,不知道什么原因?


1万页,那就是十万本书,有那么多吗? 看了下,文学传记,就快10万本了,这书还真多啊,一次抓那么多,就算不出错,估计也“死机”了

TA的精华主题

TA的得分主题

发表于 2014-11-10 10:47 | 显示全部楼层
tbjx138 发表于 2014-11-10 09:24
renahu大神,我页数设置为10000,提取4000多条就报错了,不知道什么原因?

知道原因了,因为数据多,时间就长,这个网有个特点,时间长了,就会自动退出,需要重新登录,不知道能不能不让他自动退出登录,这可能是人家网的安全措施之一吧

TA的精华主题

TA的得分主题

发表于 2014-11-10 11:07 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
renahu 发表于 2014-11-10 10:34
1万页,那就是十万本书,有那么多吗? 看了下,文学传记,就快10万本了,这书还真多啊,一次抓那么多, ...

我下了300也,3千本书,用了6分钟,还好没有退出

TA的精华主题

TA的得分主题

发表于 2014-11-10 11:36 | 显示全部楼层
注意我说的目录分类
每个分类下的书目条数是不一样的,超过了自然会报错~

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-11-10 14:14 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
renahu大神,提示是“下标越界”。

TA的精华主题

TA的得分主题

发表于 2014-11-10 15:20 | 显示全部楼层
楼主试试这个。用vbs做的。vba太占资源了。

解压后,双击运行。

中间提取不到数据时会提示楼主重新登录。

下载好的图书信息保存在vbs文档同一目录下,命名为“图书资料.csv”,可以用exce或记事本l打开。

图书.rar

852 Bytes, 下载次数: 20

TA的精华主题

TA的得分主题

发表于 2014-11-10 15:38 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 VBA万岁 于 2014-11-10 15:46 编辑
tbjx138 发表于 2014-11-10 14:14
renahu大神,提示是“下标越界”。


我这里也提示“下标越界”。

且立即窗显示的.ResponseText也未见到图书名等所需提取的数据或信息。

不知是否因登陆不成功所致——但手工用楼主所提供的用户及密码登陆时会成功。

TA的精华主题

TA的得分主题

发表于 2014-11-10 15:39 | 显示全部楼层
renahu 发表于 2014-11-10 10:08
我是2010版的,其实你一次没必要抓很多,那样会很慢的,你应该按页数范围,一批一批抓,代码里不是有个页 ...

老师   我也有一个网抓的问题想求助   能帮助我一下吗
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-26 09:17 , Processed in 0.047842 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表