ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 100|回复: 6

根据社会统一代码找注册出地址以及注册电话

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-9-11 04:51 | 显示全部楼层 |阅读模式
本帖最后由 djyang 于 2024-9-15 21:39 编辑

获取.zip (513.08 KB, 下载次数: 5) 老师能不能根据社会统一代码找注册出地址以及注册电话?一个一个找太麻烦了。[color=rgba(0, 0, 0, 0.85)]import pandas as pd    # 假设的fetch_company_info函数,实际中需要替换为真实API调用  def fetch_company_info(company_id):      # 这里只是一个示例返回,实际中应根据API的响应来构造      if company_id == '91330726336910796X':          return {              'address': '浙江省金华市武义县某街道123号',              'phone': '0579-12345678'          }      elif company_id == '9112022473849852XY':          return {              'address': '天津市某区某路A座',              'phone': '022-87654321'          }      # 其他公司ID的返回可以类似地添加      else:          return {'address': '未知', 'phone': '未知'}    # 读取Excel文件  df = pd.read_excel('社会信用代码222.xlsx')    # 假设'购方识别号'是我们要查询的统一社会信用代码列  companies_info = []    # 遍历DataFrame中的每一行,获取企业信息  for index, row in df.iterrows():      company_id = row['购方识别号']      info = fetch_company_info(company_id)      companies_info.append({          '购方识别号': company_id,          '注册地址': info['address'],          '注册电话': info['phone']      })    # 将结果转换为新的DataFrame  result_df = pd.DataFrame(companies_info)    # 显示结果  print(result_df)

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-9-11 05:04 | 显示全部楼层
import pandas as pd      # 假设的fetch_company_info函数,实际中需要替换为真实API调用   def fetch_company_info(company_id):       # 这里只是一个示例返回,实际中应根据API的响应来构造       if company_id == '91330726336910796X':           return {               'address': '浙江省金华市武义县某街道123号',               'phone': '0579-12345678'           }       elif company_id == '9112022473849852XY':           return {               'address': '天津市某区某路A座',               'phone': '022-87654321'           }       # 其他公司ID的返回可以类似地添加       else:           return {'address': '未知', 'phone': '未知'}      # 读取Excel文件   df = pd.read_excel('社会信用代码222.xlsx')      # 假设'购方识别号'是我们要查询的统一社会信用代码列   companies_info = []      # 遍历DataFrame中的每一行,获取企业信息   for index, row in df.iterrows():       company_id = row['购方识别号']       info = fetch_company_info(company_id)       companies_info.append({           '购方识别号': company_id,           '注册地址': info['address'],           '注册电话': info['phone']       })      # 将结果转换为新的DataFrame   result_df = pd.DataFrame(companies_info)      # 显示结果   print(result_df)

TA的精华主题

TA的得分主题

发表于 2024-9-11 06:46 来自手机 | 显示全部楼层
本帖最后由 excel玉米 于 2024-9-11 08:56 编辑

用python还是请大师来

TA的精华主题

TA的得分主题

发表于 2024-9-11 10:42 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
企业公示系统那里可以查,但是有图形码验证反爬,确实需要大佬才爬得了

TA的精华主题

TA的得分主题

发表于 2024-9-11 10:48 | 显示全部楼层
https://www.gsxt.gov.cn/corp-query-homepage.html
QQ20240911-104518@2x.png
1726022700762.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-9-11 20:40 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
xjl565135022 发表于 2024-9-11 10:42
企业公示系统那里可以查,但是有图形码验证反爬,确实需要大佬才爬得了

可以用企查查,就普通查找、启信宝等

TA的精华主题

TA的得分主题

发表于 2024-9-12 12:00 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 xjl565135022 于 2024-9-12 17:43 编辑
  1. <div class="blockcode"><blockquote>import time

  2. import requests
  3. from bs4 import BeautifulSoup
  4. from openpyxl import load_workbook,Workbook
  5. from concurrent.futures import ThreadPoolExecutor
  6. def data_get(url,index):
  7.     headers = {'user-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36',
  8.                'cookie': 'qcc_did=da56d80d-a133-40cf-a2e1-bf4664d6f2fd; UM_distinctid=191e406fef2e2d-0dc8b31fb5cea2-17525637-183990-191e406fef31805; QCCSESSID=ceba1c940ef43be4f55775d7ef; tfstk=fdeS_jjNvye4qr1P1HIqGNq-JrHQFy6ZRHiLjkpyvYHJJeEtu0yPrk3QRru0RXjo823Q8kFP0OWaquDnpW_NQORhjlRuPU3JwMnxbc84TNfUquDHm0aTjyqkOe6DryHLJxhxxcHpwvhdcxnn2vp-9Ldvkq0xJvhJpEdxYcLpe4nRco3mvv3KwHKx0Tg7Vi39ZmPwbCESlpp6j2lRvkAeULrrVbwL2qiSV-iSNVh2nNWaClE8IDwhXBgQ-7Urmy61lAFglJGtd99mUlNYPjN5RKG0Ml2KGSb6slqLjWhbdUIzWrFQJmVcRBg_9uPg3j-pMbFgz5hb3a9mWSEbYjNcxQuUsDUnsJ7ME4ELjRVZCTTiVSEshgSDQV_TEBtjspij7isXtBfjJzbv4xi2xbnm01jfcUanwmmjmisXtBc-mmrCciT7-; acw_tc=0a47318a17261321581815187e007a4def7a9ca4cc81449bb13b9f1c99dc6a; CNZZDATA1254842228=1018870652-1726107549-%7C1726132160'}
  9.     response=requests.get(url,headers=headers)
  10.     soup = BeautifulSoup(response.text, 'lxml')  # 格式化数据
  11.     data = soup.find_all('span', class_="max-address copy-value address-map")  # 获取数据
  12.     print(data[0].text)
  13.     ws.cell(index + 1, 4).value = data[0].text
  14.     data = soup.find_all('span', class_="f tel")  # 获取数据
  15.     print(data[0].find("span").text)
  16.     ws.cell(index + 1, 5).value = data[0].find("span").text
  17. urls=[]
  18. file_path='/Users/liaogege/Desktop/获取/清单.xlsx'
  19. wb=load_workbook(file_path)
  20. ws=wb.active
  21. index = 0
  22. for index,cell in enumerate(ws["B"]):
  23.     if index==0:
  24.         continue
  25.     if cell.value:
  26.         urls.append(f'https://www.qcc.com/web/search?key={cell.value}')
  27. index = 0
  28. for url in urls:
  29.     if url:
  30.         index+=1
  31.         time.sleep(1) # 防止被封
  32.         with ThreadPoolExecutor(max_workers=len(url)) as executor:
  33.             executor.submit(data_get,url,index)
  34. wb.save(file_path)
复制代码
2024-09-12 17.42.22.gif QQ20240912-173827@2x.png

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-9-21 11:22 , Processed in 0.049708 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表