ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 400|回复: 7

[求助] 有问网抓源码字符显示的问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-5-28 17:06 | 显示全部楼层 |阅读模式
我用VBA msxml2.xmlhttp进行网抓,responseText得到源码里,英文字母和数字可以正常显示,但是很多中文字显示的是问号,请问坛里的大神有没有办法可以把问号转化为中文字?我看了坛里的很多人提供了转码函数,但是转出来的结果并不是我希望的。

TA的精华主题

TA的得分主题

发表于 2023-5-28 17:08 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 zxsea_7426 于 2023-5-28 17:11 编辑

转码是需要看网页源码是用什么编码才行。刚开始我也这样的问题,抓到的都是一堆看不懂的符号,其实这就是编码没有转码显示不对
就像一个苹果放在那儿,谁都看懂,
如果用文字给人看,
中国人可以看懂汉字,母语是英语的能看懂英文的,母语是法语的就用法语才可以一个道理

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-28 17:10 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 逆天修炼 于 2023-5-28 17:11 编辑
zxsea_7426 发表于 2023-5-28 17:08
转码是需要看网页源码是用什么编码才行。

有个帐子说了有关查看网页源码编码的函数,但是不会用,所以我也不知原网页源码是用的什么编码?
  • function checkcode(path)
  •     set objstream=server.createobject("adodb.stream")
  •     objstream.Type=1
  •     objstream.mode=3
  •     objstream.open
  •     objstream.Position=0
  •     objstream.loadfromfile path
  •     bintou=objstream.read(2)
  •     If AscB(MidB(bintou,1,1))=&HEF And AscB(MidB(bintou,2,1))=&HBB Then
  •         checkcode="utf-8"
  •     ElseIf AscB(MidB(bintou,1,1))=&HFF And AscB(MidB(bintou,2,1))=&HFE Then
  •         checkcode="unicode"
  •     Else
  •         checkcode="gb2312"
  •     End If
  •     objstream.close
  •     set objstream=nothing
  • end function

TA的精华主题

TA的得分主题

发表于 2023-5-28 17:12 | 显示全部楼层
逆天修炼 发表于 2023-5-28 17:10
有个帐子说了有关查看网页源码编码的函数,但是不会用,所以我也不知原网页源码是用的什么编码?

StrConv(.responsebody, vbUnicode)

TA的精华主题

TA的得分主题

发表于 2023-5-28 17:12 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-28 17:18 | 显示全部楼层
本帖最后由 逆天修炼 于 2023-5-28 17:25 编辑

如果用的是UTF-8进行编码的,请问有解决网抓responsetext立即窗口显示问号的办法吗?

此外,我测试了,如果网页采用的是GB2312字体的源码,立即窗口中汉字也是显示的问号?
这个问题,是不是excel本身缺少了什么字体库啊?

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-5-28 20:27 | 显示全部楼层
perfect131 发表于 2023-5-28 17:12
3 楼 第9行
https://club.excelhome.net/forum.php?mod=redirect&goto=findpost&ptid=1508064&pid=1014876 ...

perfect131兄,你给的网贴有用,问题解决了。主要是网抓方法从msxml2改为winhttp就解决问题了

TA的精华主题

TA的得分主题

发表于 2023-6-1 11:04 | 显示全部楼层
perfect131 发表于 2023-5-28 17:12
3 楼 第9行
https://club.excelhome.net/forum.php?mod=redirect&goto=findpost&ptid=1508064&pid=1014876 ...

原来是转我的内容

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 07:19 , Processed in 0.041909 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表