ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 341|回复: 8

[求助] 如何抓取网页源代码中的指定字符?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-1-11 16:21 | 显示全部楼层 |阅读模式
网页源代码以这个网址 https://870909a.com/cj/yxym.js为目标,如何提取document.writeln后面括号中的字符,求各位大神帮忙解决,谢谢!
设置set xmlhttp=CreateObject("msxml2.xmlhttp")为作象,我写了其中这样一句代码
cells(1,2)="010"
St = Split(Split(St , Cells(1, 2) & "期七肖:</font>")(1),"</td>")(0)
但为何提取不到?


TA的精华主题

TA的得分主题

发表于 2024-1-11 21:01 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
.............

TA的精华主题

TA的得分主题

发表于 2024-1-12 02:59 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Split之前,St是什么内容

TA的精华主题

TA的得分主题

发表于 2024-1-12 03:06 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-1-12 11:43 | 显示全部楼层

set xmlhttp=CreateObject("msxml2.xmlhttp")
我个人估计是这个创建对象有问题,但我又不了解别的对象。
我按你给的代码修改了,仍然抓取不到我要的字符

TA的精华主题

TA的得分主题

发表于 2024-1-12 14:23 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
逆天修炼 发表于 2024-1-12 11:43
set xmlhttp=CreateObject("msxml2.xmlhttp")
我个人估计是这个创建对象有问题,但我又不了解别的对象。 ...

St 有内容??send 能通过??
image.png

建议换个 网站,响应太慢了这个网站

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-1-13 10:00 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
perfect131 发表于 2024-1-12 14:23
St 有内容??send 能通过??

这个源代码每行是被document.writeln("网页内容")给括起来了,正常的应该是没有document.writeln这个部分。关键是如何通过网抓取到括号中内容?

TA的精华主题

TA的得分主题

发表于 2024-1-13 10:35 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
逆天修炼 发表于 2024-1-12 11:43
set xmlhttp=CreateObject("msxml2.xmlhttp")
我个人估计是这个创建对象有问题,但我又不了解别的对象。 ...

网站返回的是什么? 如果你使用浏览器没法访问这个网站,那么这个代码也不可能读取任何内容

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-1-14 16:11 | 显示全部楼层
taller 发表于 2024-1-13 10:35
网站返回的是什么? 如果你使用浏览器没法访问这个网站,那么这个代码也不可能读取任何内容

请问版主可以通过edge浏览器访问到https://gfreqasca.www97185c.com:8443/cj/003yixiaoyima.js这个网址吗?
我的可以访问到,但是通过msxml2.xmlhttp无法抓取到responsetext,不知是什么问题?是否是网址加密了,所以无法抓取内容?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-6-29 11:54 , Processed in 0.036646 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表