ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 993|回复: 2

[求助] 如何提取网页上的超链接,并保存成txt文件

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-4-21 18:51 | 显示全部楼层 |阅读模式
本帖最后由 wwdfefgg 于 2019-4-22 15:15 编辑

如何提取这个网页  “明细”上的超链接,并保存成txt文件




QQ截图20190421184949.jpg

TA的精华主题

TA的得分主题

发表于 2019-4-21 21:18 | 显示全部楼层
  1. # -*- coding: utf-8 -*-
  2. # version: Python 3.7.0
  3. import requests,string,random,json,os

  4. headers = {'User-Agent': '(KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
  5. base_url = 'http://data.eastmoney.com'

  6. def get_url(data):
  7.     url = f'{base_url}/DataCenter_V3/stock2016/TradeDetail/pagesize=50,page=1,sortRule=-1,sortType=,startDate={data["startDate"]},endDate={data["endDate"]},gpfw=0,js=var%20data_tab_2.html?rt={data["rt"]}'
  8.     r = requests.get(url, headers=headers).content.decode('gb18030')
  9.     for i in json.loads(r.split('data_tab_2=')[1])['data']:
  10.         save_txt((i['Tdate'], i['SCode']))

  11. def save_txt(text):
  12.     save_url = f'{base_url}/stock/lhb,{text[0]},{text[1]}.html'
  13.     file_txt.writelines(save_url+'\n')

  14. if __name__ == '__main__':
  15.     file_res = r"D:\res.txt"
  16.     if os.path.isfile(file_res): os.remove(file_res)
  17.     file_txt = open(file_res, 'a', encoding='utf-8')
  18.     data = {
  19.         'rt': ''.join(map(lambda x: random.choice(string.digits), range(8))),
  20.         'startDate': '2019-04-17',
  21.         'endDate': '2019-04-19'
  22.     }
  23.     get_url(data)
  24.     file_txt.close()
复制代码

TA的精华主题

TA的得分主题

发表于 2019-4-22 12:28 | 显示全部楼层
试试附件看看

TEST.zip

46.01 KB, 下载次数: 8

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-19 21:34 , Processed in 0.037388 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表