ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 717|回复: 8

[求助] Excel2013如何抓取网页多页指定数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-4-21 22:14 | 显示全部楼层 |阅读模式
那位前辈有空指点一下如下:
http://www.kshome.com.cn:8087/soldlist.aspx?page=1(合计103页)
250.png
不胜感激QQ344046229可以红包感谢

TA的精华主题

TA的得分主题

发表于 2019-4-22 07:05 | 显示全部楼层
结果见附件

数据获取.zip

79.17 KB, 下载次数: 25

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-4-21 23:15 | 显示全部楼层
可联系 2729311948 最近专门研究这块

TA的精华主题

TA的得分主题

发表于 2019-4-21 23:53 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-4-22 01:40 | 显示全部楼层
  1. # -*- coding: utf-8 -*-
  2. # version: Python 3.7.0
  3. import requests,os,csv,parsel

  4. def get_html(data):
  5.     r = requests.get(base_url, params=data, headers=headers)
  6.     parse_html(r.content.decode('utf-8'))

  7. def parse_html(text):
  8.     tr_list = parsel.Selector(text).xpath('//*[@id="div_listing"]//tr[not(@class)][not(td[div])]')
  9.     for tr in tr_list:
  10.         td_list = [td.xpath('string(.)').get() for td in tr.xpath('td')]
  11.         csv.writer(f_point).writerow(td_list)

  12. if __name__ == '__main__':
  13.     file_path = r'D:\result.csv'#自定义保存的csv文件
  14.     if os.path.isfile(file_path): os.remove(file_path)
  15.     f_point = open(file_path, 'a', encoding='utf-8-sig', newline='')
  16.     csv.writer(f_point).writerow(['挂牌编号','行政区','房屋座落','房屋用途','建筑面积','售价(万)','上架时间'])
  17.     headers = {'User-Agent': '(KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
  18.     base_url = 'http://www.kshome.com.cn:8087/soldlist.aspx'
  19.     for i in range(5):#设置抓取页数,也可以动态获取“总页数”!!!
  20.         get_html({'page': i+1})
  21.     f_point.close()
复制代码

TA的精华主题

TA的得分主题

发表于 2019-4-22 06:54 来自手机 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-4-23 16:19 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-4-23 16:23 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-4-23 20:05 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

前辈怎么红包感谢你啊
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-27 05:40 , Processed in 0.035590 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表