ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4209|回复: 7

[求助] fiddler抓包到以下数据,如何获取真实地址

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-22 20:06 | 显示全部楼层 |阅读模式
本帖最后由 jonn 于 2018-7-23 00:48 编辑

刚学抓包,想弄个数据库,方便自己的工作。
保健食品批文数据,
网站地址:http://app1.sfda.gov.cn/datasear ... 7027083838706701567

通过fiddler抓包得到以下信息,但水平有限,无法获取真正地址,请高手帮忙解决,谢谢大家!!

附件是fiddler抓包的截图 及导出文件。导出文件可以通过fiddler重新导入来看详细代码。

说明:第一行代码中的空格部分(tableview=后面内容) tableview=        ʳƷ,有乱码,估计是 %E5%9B%BD%E4%BA%A7%E4%BF%9D%E5%81%A5%E9%A3%9F%E5%93%81   或者  国产保健食品  或者  鍥戒骇淇濆仴椋熷搧 抓包1.jpg

GET http://app1.sfda.gov.cn/datasear ... =TABLE30&tableView=        ʳƷ&Id=1425&MmEwMD=gb2312-2vBFMhQtVoDuMQbIz8dVoLXHII8aQlq24.uouT6_HGUkZ0gyctLmrARCZxu3ss89Xdg_Bbv.elJcqNsLgrerjXWoz6ldk.mMgsSCFeUIhCikNbNSIv6zk7e8yHR8Zr6kVSMMD2X7DtZ2ocW5j7aCvt2.q31hyzrsem9tHPAi_gL64HT94SNfHRuUHLsyeWhFI680ZTJwmE2BbkBjMLPhHzf9iFhCAn.mDd3JPUi8GehH17DlbhwOyAEnBKhcsxdezusfsbii6Fn_zKkOxGnylFbqif9WwAPyP7bib6hWEjBuhIMD1Tix7tolIXoEsz1osV9cg4AimRBciMy00mb6DBdtRlAOwlxJP.QoB43b8bSsAjGd6aQSxf49avzG.pdqdyHBoGMjPRBlkIa6SPGPciP0QvNI9LEu1zehA2JaIWvmtHN HTTP/1.1
Accept: */*
Content-Type: text/html;encoding=gbk
Referer: http://app1.sfda.gov.cn/datasear ... 7027083838706701567
Accept-Language: zh-CN
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko
Host: app1.sfda.gov.cn
Connection: Keep-Alive
Cookie: JSESSIONID=62891DB39D6D045A4121882FC6BEAB0B.7; FSSBBIl1UgzbN7N82T=2ZRv0Aj64Qai0oAPcmxNLu3nalLJuIC3Vam_QXroG4f5sBilzp8gXhBhs1m2ZELRr9ioqepK1I4dBn2YUFhZmT__czc.9xOpBCf_Y3WEdXdn.xBoFRy90A.FLesMrD6b3uabI9VcW4xYWNCW3E4G25tHLLoojFg235xZwznyN8dpQxZI7w54iZE8_yWXfujsBZdtOJmLYBEePUqUCcwQWt_gJVeep.jmhhnMYUz1OIHXaW6ZVccey_YsfqDJq3LTI_.N0nbkKUrCQLmOrj..SxUgykrA9E6dmnlgWeNrmIqGdFnELhb86Io8QgB40QBxX.XfI4j9Xt39tBMVf30LjW0Jj3JN0ukR_vh4gKdvS6RujKa; FSSBBIl1UgzbN7N82S=WZSZwEARgWYJmqWaV.nXcE9SqHaUL3MDn56Cee5Vtij9mgkKamV2M9wJhCP2dB3h





HTTP/1.1 200 OK
Date: Sun, 22 Jul 2018 19:37:43 GMT
Content-Type: text/html;charset=utf-8
Connection: keep-alive
X-Frame-Options: SAMEORIGIN
Set-Cookie: JSESSIONID=57A048F5C5F7E4EEA63DFE55EF24DAF7.7; Path=/datasearch
Server: server_5022b618eb8f6
Content-Length: 7237












<html>
<head>

<link href="css/index.css" rel="stylesheet" type="text/css" media="all" />
</head>
<div class="listmain">




<div>


<table width=100% align=center>
<tr bgcolor="#659ace">
    <td height="25" colspan="2">
            <div align="center" class=zs2 style="float:left;text-align:center;width:80%;padding-left:40px">国产保健食品</div>
            <div style="float:right"><img src=images/data_fanhui.gif onclick=javascript:viewList() style=cursor:pointer></div>
    </td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">产品名称</td>
    <td bgcolor="#eaeaea" width=83%>龙藏牌龙藏胶囊</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">批准文号</td>
    <td bgcolor="#ffffff" width=83%>卫食健字(2001)第0119号</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">产品编号</td>
    <td bgcolor="#eaeaea" width=83%>8744</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">有效期至</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">申请人中文名称</td>
    <td bgcolor="#eaeaea" width=83%>北京大威德文化有限公司</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">申请人地址</td>
    <td bgcolor="#ffffff" width=83%>北京市昌平区南口辛力庄</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">保健功能</td>
    <td bgcolor="#eaeaea" width=83%>延缓衰老</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">功效成分/标志性成分含量</td>
    <td bgcolor="#ffffff" width=83%>每100g含:甘露醇 3.6g  腺苷 53mg、总黄酮 190mg</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">主要原料</td>
    <td bgcolor="#eaeaea" width=83%>蝙蝠蛾拟青霉、佛手、天冬、黄精、当归</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">适宜人群</td>
    <td bgcolor="#ffffff" width=83%>中老年人</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">不适宜人群</td>
    <td bgcolor="#eaeaea" width=83%>孕妇、少年儿童</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">食用方法及食用量</td>
    <td bgcolor="#ffffff" width=83%>每日2次,每次3粒,温开水送食</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">产品规格</td>
    <td bgcolor="#eaeaea" width=83%>500mg/粒</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">产品技术要求</td>
    <td bgcolor="#ffffff" width=83%>根据《关于印发保健食品产品技术要求规范的通知》,2011年2月1日前受理的产品暂无技术要求。</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">保质期</td>
    <td bgcolor="#eaeaea" width=83%>24个月</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">贮藏方法</td>
    <td bgcolor="#ffffff" width=83%>通风,置阴凉干燥处</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">注意事项</td>
    <td bgcolor="#eaeaea" width=83%>本品不能代替药物</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">批准日期</td>
    <td bgcolor="#ffffff" width=83%>2001-05-20</td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">批准变更日期</td>
    <td bgcolor="#eaeaea" width=83%>2004-04-21</td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">变更内容</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">备案日期</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">备案内容</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">转让方中文名称</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">转让方英文名称</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">转让方地址</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">受让方</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">受让方地址</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">转让前批准文号</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">批准转让日期</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">补发日期</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">注销日期</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td bgcolor="#ffffff" style="text-align:right" width=17% nowrap="true">注销原因</td>
    <td bgcolor="#ffffff" width=83%></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right" width=17% nowrap="true">备注</td>
    <td bgcolor="#eaeaea" width=83%></td></tr>

<tr>
    <td></td>
    <td></td></tr>

<tr>
    <td bgcolor="#eaeaea" style="text-align:right">注</td>
    <td bgcolor="#eaeaea"><span style="FONT-SIZE: 14px; COLOR: #000066">本数据库提供自2003年12月12日之后经国家食品药品监督管理总局审批的保健食品的基本信息。如发现查询的保健食品注册信息与企业所持保健食品注册证书不一致或对相关信息有疑问,请将相关材料及联系方式以传真、邮寄或电子邮件形式提交国家食品药品监督管理总局保健食品审评中心质量管理处,传真:010-63703550;邮寄地址:北京市丰台区南四环西路188号11区15号楼(邮编:100070);电子邮件:bjspjszc@bjsp.gov.cn。</span></td></tr>
</table>

<table>
<tr height="35">
    <td style=cursor:pointer><img src="images/search_back.gif"/></td></tr>
</table>

<a href="/stream_4f7ec2a26362a/admin/" style="display:none">admin</a><a href="/stream_4f7ec2a26362a/wp-admin/" style="display:none">wp-admin</a><a href="/stream_4f7ec2a26362a/backend/" style="display:none">backend</a></body>
</html>



抓包2.jpg

抓包3.jpg

抓包fillder导入文件4SFDA.rar (5.26 KB, 下载次数: 6)

再次感谢各位!!!!

TA的精华主题

TA的得分主题

发表于 2018-7-23 21:03 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
GET http://app1.sfda.gov.cn/datasear ... =TABLE30&tableView=        &#691;&#439;&Id=1425&MmEwMD=gb2312-2vBFMhQtVoDuMQbIz8dVoLXHII8aQlq24.uouT6_HGUkZ0gyctLmrARCZxu3ss89Xdg_Bbv.elJcqNsLgrerjXWoz6ldk.mMgsSCFeUIhCikNbNSIv6zk7e8yHR8Zr6kVSMMD2X7DtZ2ocW5j7aCvt2.q31hyzrsem9tHPAi_gL64HT94SNfHRuUHLsyeWhFI680ZTJwmE2BbkBjMLPhHzf9iFhCAn.mDd3JPUi8GehH17DlbhwOyAEnBKhcsxdezusfsbii6Fn_zKkOxGnylFbqif9WwAPyP7bib6hWEjBuhIMD1Tix7tolIXoEsz1osV9cg4AimRBciMy00mb6DBdtRlAOwlxJP.QoB43b8bSsAjGd6aQSxf49avzG.pdqdyHBoGMjPRBlkIa6SPGPciP0QvNI9LEu1zehA2JaIWvmtHN HTTP/1.1

Content-Type: text/html;encoding=gbk
Referer: http://app1.sfda.gov.cn/datasear ... 7027083838706701567





Cookie: JSESSIONID=62891DB39D6D045A4121882FC6BEAB0B.7; FSSBBIl1UgzbN7N82T=2ZRv0Aj64Qai0oAPcmxNLu3nalLJuIC3Vam_QXroG4f5sBilzp8gXhBhs1m2ZELRr9ioqepK1I4dBn2YUFhZmT__czc.9xOpBCf_Y3WEdXdn.xBoFRy90A.FLesMrD6b3uabI9VcW4xYWNCW3E4G25tHLLoojFg235xZwznyN8dpQxZI7w54iZE8_yWXfujsBZdtOJmLYBEePUqUCcwQWt_gJVeep.jmhhnMYUz1OIHXaW6ZVccey_YsfqDJq3LTI_.N0nbkKUrCQLmOrj..SxUgykrA9E6dmnlgWeNrmIqGdFnELhb86Io8QgB40QBxX.XfI4j9Xt39tBMVf30LjW0Jj3JN0ukR_vh4gKdvS6RujKa; FSSBBIl1UgzbN7N82S=WZSZwEARgWYJmqWaV.nXcE9SqHaUL3MDn56Cee5Vtij9mgkKamV2M9wJhCP2dB3h




一般网抓   这些是要关键关注的

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 01:58 | 显示全部楼层
二级页面的网抓  而且代码中没有完整链接地址。
希望老师们出手帮忙。感谢

TA的精华主题

TA的得分主题

发表于 2018-7-24 08:09 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-24 09:56 来自手机 | 显示全部楼层
没有太明白你要抓取的 最终数据 。

TA的精华主题

TA的得分主题

发表于 2018-7-24 10:02 | 显示全部楼层
本帖最后由 sheeboard 于 2018-7-24 10:05 编辑

js网页用selenium抓,利用浏览器解析js代码,就是速度慢点,要么自己写js解析器。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 12:08 | 显示全部楼层
duquancai 发表于 2018-7-24 09:56
没有太明白你要抓取的 最终数据 。

最终数据 是每个批文的详细数据
最终数据.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 12:09 | 显示全部楼层
sheeboard 发表于 2018-7-24 10:02
js网页用selenium抓,利用浏览器解析js代码,就是速度慢点,要么自己写js解析器。

前几天也大概看了selenium的用法 准备安装个看看  谢谢提醒
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-10 21:25 , Processed in 0.046426 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表