ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4646|回复: 10

[求助] Fiddler抓包问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-10-10 14:21 | 显示全部楼层 |阅读模式
哪位大神帮助看一下, 一个网址输入在浏览器是可以看到内容,但是fiddler中是空的呢?
以下是网址
https://seekingalpha.com/symbol/ ... _transcripts?page=2


以下是fiddler中的界面body=0,是空的


Snipaste_2018-10-10_14-20-26.jpg

TA的精华主题

TA的得分主题

发表于 2018-10-10 14:44 | 显示全部楼层
304 为抓取失败

TA的精华主题

TA的得分主题

发表于 2018-10-10 14:49 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-10-10 14:57 | 显示全部楼层
想网抓,就要了解http各种状态码的意义
下图是按Ctrl+F5强制刷新的结果
TIM截图20181010145434.png

TA的精华主题

TA的得分主题

发表于 2018-10-10 15:25 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
我是来讨说法的 发表于 2018-10-10 14:57
想网抓,就要了解http各种状态码的意义
下图是按Ctrl+F5强制刷新的结果

虚心请教老师:抓取的结果如何处理?即怎么提取。

TA的精华主题

TA的得分主题

发表于 2018-10-10 15:32 | 显示全部楼层
cunfu2010 发表于 2018-10-10 15:25
虚心请教老师:抓取的结果如何处理?即怎么提取。

解析html
截取字符串
正则等等,不知道你要提取什么

TA的精华主题

TA的得分主题

发表于 2018-10-10 15:55 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
我是来讨说法的 发表于 2018-10-10 15:32
解析html
截取字符串
正则等等,不知道你要提取什么

解析html,提取网页显示的内容。如:
American Equity Investment Life Holding's CEO Discusses Q1 2014 Results - Earnings Call Transcript
May 2, 2014
所有的。

TA的精华主题

TA的得分主题

发表于 2018-10-10 16:13 | 显示全部楼层
cunfu2010 发表于 2018-10-10 15:55
解析html,提取网页显示的内容。如:
American Equity Investment Life Holding's CEO Discusses Q1 201 ...
  1. Sub x()
  2. Dim xml As New XMLHTTP60
  3. Dim Result As String

  4. With xml
  5.     .Open "GET", "https://seekingalpha.com/symbol/AEL/earnings/more_transcripts?page=2"
  6.     .send
  7.     Debug.Print .responseText
  8.     Result = .responseText
  9. End With
  10. For Each k In Split(Result, "American Equity")
  11.     Debug.Print "American Equity " & Split(k, "</a>")(0)
  12. Next
  13. End Sub
复制代码

细节自己处理

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-10-14 10:07 | 显示全部楼层

老师,您好, 我按您的语句, 引用了Microsoft XML, v6.0,然后执行下来得到.responsetext是发下内容, 能否麻烦看下是什么吗? , 一旦解决, 立即上分, 谢谢


<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1">
  <title>Access to this page has been denied.</title>
  <link href="https://fonts.googleapis.com/css?family=Open+Sans:300" rel="stylesheet">
  <style>
    html, body {
      margin: 0;
      padding: 0;
      font-family: 'Open Sans', sans-serif;
      color: #000;
    }

    .container {
      align-items: center;
      display: flex;
      flex: 1;
      justify-content: space-between;
      flex-direction: column;
      height: 100%;
    }

    .container > div {
      width: 100%;
      display: flex;
      justify-content: center;
    }

    .container > div > div {
      display: flex;
      width: 80%;
    }

    .customer-logo-wrapper {
      padding-top: 2rem;
      flex-grow: 0;
      background-color: #fff;
    }

    .customer-logo {
      border-bottom: 1px solid #000;
    }

    .customer-logo > img {
      padding-bottom: 1rem;
      max-height: 50px;
      max-width: 100%;
    }

    .page-title-wrapper {
      flex-grow: 0;  /* was 2, but that pushed it too far down the page */
    }

    .page-title {
      flex-direction: column-reverse;
    }

    .content-wrapper {
      flex-grow: 5;
    }

    .content {
      flex-direction: column;
    }

    @media (min-width: 768px) {
      html, body {
        height: 100%;
      }
    }
  </style>
  <script>window._pxAppId =                       'PXxgCxM9By';</script>
  <script async src="https://client.perimeterx.net/PXxgCxM9By/main.min.js"></script>
  <script>
    var captchaResponse;
    var handled = false;  // Ensure we don't run handleCaptcha() twice
    var startTime = Date.now();

    function handleCaptchaOnce() {
      if (! handled) {
        handled = true;
        handleCaptcha(captchaResponse);  // handler injected by PerimeterX
      }
    }

    function trackCaptchaSolvedAndPuntToPerimeterX(response) {
      captchaResponse = response;
      var captchaSolutionInSeconds = Math.floor((Date.now() - startTime)/1000);
      var xhr = new XMLHttpRequest();
      xhr.open("GET", "/_sa_track/captcha/solved?px_uuid=9586cf50-cf55-11e8-ba0f-41df58541ab8&time_to_solution=" + captchaSolutionInSeconds);
      xhr.addEventListener("load", handleCaptchaOnce);
      xhr.send();
      setTimeout(750, handleCaptchaOnce);
    }
  </script>
<script src = "https://www.google.com/recaptcha/api.js"></script><script type="text/javascript">window.px_vid = "";  function handleCaptcha(response){ var vid=""; var uuid="9586cf50-cf55-11e8-ba0f-41df58541ab8"; var name="_pxCaptcha "; var expiryUtc=new Date(Date.now()+1000*10).toUTCString(); var cookieParts = [name,"=",btoa(JSON.stringify({r: response, v: vid, u: uuid})),"; expires=",expiryUtc,"; path=/"]; document.cookie=cookieParts.join(""); location.reload();  }</script></head>

<body>
<section class="container">
  <div class="customer-logo-wrapper" style="visibility: hidden">
    <div class="customer-logo">
      <imgXXX src="" alt="Logo"/>
    </div>
  </div>
  <div class="page-title-wrapper">
    <div class="page-title">
      <h1>Please click “I am not a robot” to continue</h1>
    </div>
  </div>
  <div class="content-wrapper">
    <div class="content">
      <div class="g-recaptcha" data-theme="dark"
           data-sitekey="6Lcj-R8TAAAAABs3FrRPuQhLMbp5QrHsHufzLf7b"
           data-callback="trackCaptchaSolvedAndPuntToPerimeterX"
      ></div>
      <p></p>
      <p>
        To ensure this doesn’t happen in the future, please enable Javascript and cookies in your browser.<br/>
        Is this happening to you frequently? Please <a href="https://seekingalpha.userecho.com?source=captcha">report it on our feedback forum</a>.
      </p>
    </div>
  </div>
  <img src="/_sa_track/captcha/shown?px_uuid=9586cf50-cf55-11e8-ba0f-41df58541ab8" width="1" height="1" />
</section>
</body>
</html>

TA的精华主题

TA的得分主题

发表于 2018-10-14 11:35 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-17 02:55 , Processed in 0.025976 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表