|
各位大神好,我需要在某网站复制多页数据。但是网址不会根据筛选结果和翻页而产生变化,同时网页数也会因为数据的有效日期而增增页或减页。
网址一:http://scjgj.gz.gov.cn/gzfda/bmyyqt/spyjjbmcx/spyjj_05.jsp
要求:
1.网页内许可证号:可以选择填写为(粤D或空);
2.网页内的发证日期:yyyy-mm-dd至yyyy-mm-dd可以手动调整;
3.网页内的有效期至:yyyy-mm-dd至yyyy-mm-dd可以手动调整;
4.因为要求1.2.3,选取日期的范围不同,数据多少不同,页数也会变化,所以也希望最大页数可以自动获取(或者能让我根据查询结果的页数手动调整复制页数);
5.复制查询结果网页的/序号/许可证号/企业名称/经营地址/法定代表人(负责人)/经营方式/经营项目/发证日期/有效期至 /全部数据入excel表(许可证号关联的链接能保存最好,保存为文本节省文档空间也可以);
6.复制到excel表中的数据有较多空格,希望能自动去除后保存(可选)。
以上要求5必须完成,
要求1是通过许可证号粤D来快速区分经营方式中的单体零售企业或零售连锁门店;
要求23能增加筛选起止日期是为了能每月更新数据用;
增加要求1234是为了能减少数据(有近7000条,700页),从而减少提取数据的时间提高效率。
网址二:http://scjgj.gz.gov.cn/gzfda/bmyyqt/spyjjbmcx/spyjj_06.jsp
要求:
1.网页内的发证日期:yyyy-mm-dd至yyyy-mm-dd可以手动调整
2.网页内的有效期至:yyyy-mm-dd至yyyy-mm-dd可以手动调整
3.因为要求1.2,选取日期的范围不同,数据多少不同,页数也会变化,所以也希望最大页数可以自动获取(或者能让我根据查询结果的页数手动调整复制页数)
4.复制查询结果网页的/序号/许可证号/企业名称/经营地址/经营方式/认证范围/认证日期/有效期至/全部数据入excel表(许可证号关联的链接能保存最好,保存为文本节省文档空间也可以)
5.复制到excel表中的数据有较多空格,希望能自动去除后保存(可选)。
以上要求4必须完成,
要求1.2能增加筛选起止日期是为了能每月更新数据用;
增加要求123是为了能减少数据(有近7000条,700页),从而减少提取数据的时间提高效率。
以上两个请分别做成两个表格。以上要求能满足可以的话有红包感谢,微信或支付宝皆可。
|
|