ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 12786|回复: 22

[讨论] 目的很明确,学“网页数据抓取”。但一直找不到门,不知如何下手?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2012-2-2 21:26 | 显示全部楼层 |阅读模式
本帖最后由 引子玄 于 2012-2-2 21:35 编辑

目的很明确,学“网页数据抓取”。——是那种比较复杂的网页数据抓取,如100多家公司数据的变化走势数据——网页现成的静态数据(按公司分类)。
但一直找不到门,不知如何下手?
折腾了很长时间,还在门槛外游荡~~~~~

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-2-2 21:28 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
要是有免费的数据抓取的工具就好了,可以省却很多困难

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-2-3 20:49 | 显示全部楼层
本帖最后由 引子玄 于 2012-2-3 20:49 编辑

求问大家,我直接学SQL(不学ACCESS),行吗?因为我主要是学"数据抓取"建立数据仓库,为的是导入到EXCEL中使用.

TA的精华主题

TA的得分主题

发表于 2012-2-4 01:48 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
最好有个附件{:soso_e177:}

彩票在线更新系统.rar

14.01 KB, 下载次数: 131

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-2-4 17:08 | 显示全部楼层
本帖最后由 引子玄 于 2012-2-4 22:40 编辑
xsy我可以很好 发表于 2012-2-4 01:48
最好有个附件


就是“网页数据抓取”自动化弄成这个样子的EXCEL数据库
(数据被抓取网页
http://1x2.bet007.com/oddslist/566016.htm

把每个公司的后台隐藏的数据走势,抓取到如附件中的EXCEL数据库中)




EXCEL数据库样式.zip

7.49 KB, 下载次数: 104

如何自动化建数据库?

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-2-4 21:00 | 显示全部楼层
本帖最后由 引子玄 于 2012-2-4 21:48 编辑
引子玄 发表于 2012-2-4 17:08
就是“网页数据抓取”自动化弄成这个样子的EXCEL数据库
(数据被抓取网页http://1x2.bet007.com/oddsli ...


自己感觉应该是有难度的。因为从自己接触到的网民(会做这个的)来看,他们是要收费的(出售此类软件)。可见这个DD很多人不会弄,并有一定难度。自己是这么推测的——至少靠EXCEL技术是不能够解决的(自动化抓取网页数据),它必须依靠EXCEL之外的其他OFFICE软件来完成这个复杂作业——数据库,还可能是比较复杂难搞的数据库(涉及抓取后台数据——需要无数次的再点击打开弹出小网页的数据),有时还可能要应付数据网站设置的屏障。

如果把EXCEL比做“巧妇”的话。
那么数据库则是“米”。

搞不好数据库,EXCEL “巧妇难为无米之炊”,由此可见“数据库”的重要性。

TA的精华主题

TA的得分主题

发表于 2012-2-4 22:13 | 显示全部楼层
为什么不从后台数据库取数呢?

TA的精华主题

TA的得分主题

发表于 2012-2-4 22:20 | 显示全部楼层
zhangjimfu 发表于 2012-2-4 22:13
为什么不从后台数据库取数呢?

LZ是个“贼”,好比如对贼说,为什么不去银行金库拿钱一样

TA的精华主题

TA的得分主题

发表于 2012-2-4 22:28 | 显示全部楼层
Renco 发表于 2012-2-4 22:20
LZ是个“贼”,好比如对贼说,为什么不去银行金库拿钱一样

Renco形容很贴切,也很有道理,如果是自家数据就不必大费周折了,呵呵....

TA的精华主题

TA的得分主题

发表于 2012-2-5 02:14 | 显示全部楼层
其实用XML是可以抓取数据的,不过也是一件比较麻烦的事情,必须先分析网页的HTML标识,然后才好分离数据出来。之前回复过一个帖子。
发帖者用的是Excel,希望用Access处理。——我这人比较懒,所以只对ta的部分代码进行了小部分的修改而已,详细请查看以下链接:
http://club.excelhome.net/thread-813791-1-1.html
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-25 12:54 , Processed in 0.046811 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表