根据社会统一代码找注册出地址以及注册电话

djyang · 发表于 2024-9-11 04:51

本帖最后由 djyang 于 2024-9-15 21:39 编辑

获取.zip (513.08 KB, 下载次数: 10) 老师能不能根据社会统一代码找注册出地址以及注册电话？一个一个找太麻烦了。[color=rgba(0, 0, 0, 0.85)]import pandas as pd # 假设的fetch_company_info函数，实际中需要替换为真实API调用 def fetch_company_info(company_id): # 这里只是一个示例返回，实际中应根据API的响应来构造 if company_id == '91330726336910796X': return { 'address': '浙江省金华市武义县某街道123号', 'phone': '0579-12345678' } elif company_id == '9112022473849852XY': return { 'address': '天津市某区某路A座', 'phone': '022-87654321' } # 其他公司ID的返回可以类似地添加 else: return {'address': '未知', 'phone': '未知'} # 读取Excel文件 df = pd.read_excel('社会信用代码222.xlsx') # 假设'购方识别号'是我们要查询的统一社会信用代码列 companies_info = [] # 遍历DataFrame中的每一行，获取企业信息 for index, row in df.iterrows(): company_id = row['购方识别号'] info = fetch_company_info(company_id) companies_info.append({ '购方识别号': company_id, '注册地址': info['address'], '注册电话': info['phone'] }) # 将结果转换为新的DataFrame result_df = pd.DataFrame(companies_info) # 显示结果 print(result_df)

djyang · 发表于 2024-9-11 05:04

import pandas as pd # 假设的fetch_company_info函数，实际中需要替换为真实API调用 def fetch_company_info(company_id): # 这里只是一个示例返回，实际中应根据API的响应来构造 if company_id == '91330726336910796X': return { 'address': '浙江省金华市武义县某街道123号', 'phone': '0579-12345678' } elif company_id == '9112022473849852XY': return { 'address': '天津市某区某路A座', 'phone': '022-87654321' } # 其他公司ID的返回可以类似地添加 else: return {'address': '未知', 'phone': '未知'} # 读取Excel文件 df = pd.read_excel('社会信用代码222.xlsx') # 假设'购方识别号'是我们要查询的统一社会信用代码列 companies_info = [] # 遍历DataFrame中的每一行，获取企业信息 for index, row in df.iterrows(): company_id = row['购方识别号'] info = fetch_company_info(company_id) companies_info.append({ '购方识别号': company_id, '注册地址': info['address'], '注册电话': info['phone'] }) # 将结果转换为新的DataFrame result_df = pd.DataFrame(companies_info) # 显示结果 print(result_df)

excel玉米 · 发表于 2024-9-11 06:46

本帖最后由 excel玉米于 2024-9-11 08:56 编辑

用python还是请大师来

xjl565135022 · 发表于 2024-9-11 10:42

企业公示系统那里可以查，但是有图形码验证反爬，确实需要大佬才爬得了

xjl565135022 · 发表于 2024-9-11 10:48

https://www.gsxt.gov.cn/corp-query-homepage.html

djyang · 发表于 2024-9-11 20:40

xjl565135022 发表于 2024-9-11 10:42
企业公示系统那里可以查，但是有图形码验证反爬，确实需要大佬才爬得了

可以用企查查，就普通查找、启信宝等

xjl565135022 · 发表于 2024-9-12 12:00

本帖最后由 xjl565135022 于 2024-9-12 17:43 编辑

<div class="blockcode"><blockquote>import time
import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook,Workbook
from concurrent.futures import ThreadPoolExecutor
def data_get(url,index):
headers = {'user-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36',
'cookie': 'qcc_did=da56d80d-a133-40cf-a2e1-bf4664d6f2fd; UM_distinctid=191e406fef2e2d-0dc8b31fb5cea2-17525637-183990-191e406fef31805; QCCSESSID=ceba1c940ef43be4f55775d7ef; tfstk=fdeS_jjNvye4qr1P1HIqGNq-JrHQFy6ZRHiLjkpyvYHJJeEtu0yPrk3QRru0RXjo823Q8kFP0OWaquDnpW_NQORhjlRuPU3JwMnxbc84TNfUquDHm0aTjyqkOe6DryHLJxhxxcHpwvhdcxnn2vp-9Ldvkq0xJvhJpEdxYcLpe4nRco3mvv3KwHKx0Tg7Vi39ZmPwbCESlpp6j2lRvkAeULrrVbwL2qiSV-iSNVh2nNWaClE8IDwhXBgQ-7Urmy61lAFglJGtd99mUlNYPjN5RKG0Ml2KGSb6slqLjWhbdUIzWrFQJmVcRBg_9uPg3j-pMbFgz5hb3a9mWSEbYjNcxQuUsDUnsJ7ME4ELjRVZCTTiVSEshgSDQV_TEBtjspij7isXtBfjJzbv4xi2xbnm01jfcUanwmmjmisXtBc-mmrCciT7-; acw_tc=0a47318a17261321581815187e007a4def7a9ca4cc81449bb13b9f1c99dc6a; CNZZDATA1254842228=1018870652-1726107549-%7C1726132160'}
response=requests.get(url,headers=headers)
soup = BeautifulSoup(response.text, 'lxml') # 格式化数据
data = soup.find_all('span', class_="max-address copy-value address-map") # 获取数据
print(data[0].text)
ws.cell(index + 1, 4).value = data[0].text
data = soup.find_all('span', class_="f tel") # 获取数据
print(data[0].find("span").text)
ws.cell(index + 1, 5).value = data[0].find("span").text
urls=[]
file_path='/Users/liaogege/Desktop/获取/清单.xlsx'
wb=load_workbook(file_path)
ws=wb.active
index = 0
for index,cell in enumerate(ws["B"]):
if index==0:
continue
if cell.value:
urls.append(f'https://www.qcc.com/web/search?key={cell.value}')
index = 0
for url in urls:
if url:
index+=1
time.sleep(1) # 防止被封
with ThreadPoolExecutor(max_workers=len(url)) as executor:
executor.submit(data_get,url,index)
wb.save(file_path)

复制代码

65861954 · 发表于 2024-9-24 14:27

xjl565135022 发表于 2024-9-12 12:00

你把您的cookies直接这样放在网上不怕吗：？

用户名		自动登录	找回密码
密码			免费注册

根据社会统一代码找注册出地址以及注册电话

评分