1234

ExcelHome技术论坛

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

帖子
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3076|回复: 14

[求助] 请教如何根据网页源码,获取想要的内容

[复制链接]

TA的精华主题

TA的得分主题

发表于 2017-1-9 19:51 | 显示全部楼层 |阅读模式
          条件根据路径获取:/html/body/div[2]/div[1]/p[2]
           对应的结果是红色的字体
           & "<html><body>" _
                    & "<div id='myList'>" _
                                & "<div ID='1'>Coffee</div>" _
                                & "<div ID='2'>" _
                                    & "<p ID='3'>Coffee</p>" _
                                    & "<p ID='4'>Coffee</p>" _
                                & "</div>" _
                        & "</div>" _
                    & "<div id='5'>" _
                                & "<nav ID='6'>" _
                                    & "<div ID='7'>Coffee</div>" _
                                & "</nav>" _
                                & "<div ID='8'>" _
                                    & "<p ID='9'>Coffee</p>" _
                                    & "<p ID='10'>Coffee</p>" _
                                & "</div>" _
                                & "<div ID='11'>" _
                                    & "<p ID='12'>Coffee</p>" _
                                    & "<p ID='13'>Coffee</p>" _
                                & "</div>" _
                    & "</div>" _
            & "</body></html>"

TA的精华主题

TA的得分主题

发表于 2017-1-9 19:53 | 显示全部楼层
这个说来话就长了,建议论坛搜索

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 19:54 | 显示全部楼层
huang1314wei 发表于 2017-1-9 19:53
这个说来话就长了,建议论坛搜索

论坛没有的,网上别人有做的软件,不过处理的也不对

TA的精华主题

TA的得分主题

发表于 2017-1-9 19:55 | 显示全部楼层
sac100 发表于 2017-1-9 19:54
论坛没有的,网上别人有做的软件,不过处理的也不对

那没有办法呀,你这个贴写的太low了,没有网址,也没有附件,就贴个源代码上来有什么用呢?

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 20:00 | 显示全部楼层
huang1314wei 发表于 2017-1-9 19:55
那没有办法呀,你这个贴写的太low了,没有网址,也没有附件,就贴个源代码上来有什么用呢?

网页源码太复杂了,看起来没这个清晰
处理这个问题,怎么说呢
是这样,就是很多网站写的源码不标准,根据路径,去处理,会碰到问题
                                & "<nav ID='6'>" _
                                    & "<div ID='7'>Coffee</div>" _
                                & "</nav>" _
这样就错了,因为div不能在nav的里面,如果nva改成div,那么这个问题就解决了
关键是网页中很多都是并不符合标准的

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 20:05 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
  & "<div id='5'>" 的子节点,中的第一个DIV & "<div ID='7'>Coffee</div>" _【这样就错了】
真确的应该是& "<div ID='8'>" _

如果将NAV改成div
  & "<div id='5'>" 的子节点,中的第一个DIV 应该就是ID=6

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 20:28 | 显示全部楼层
网页源码不标准真吭
简单的理解ID=6的下一个同胞节点应该是id=8的那个同胞节点
但是由于div不能写在nav下,所以得到的结果是下一个同胞节点是id=7

TA的精华主题

TA的得分主题

发表于 2017-1-9 20:29 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
用正则去匹配,或split去掐头去尾要中间。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 20:31 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Kaohsing 发表于 2017-1-9 20:29
用正则去匹配,或split去掐头去尾要中间。

只能使用唯一条件解决
条件根据路径获取

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-1-9 21:03 | 显示全部楼层
节点集合
循环得到每一个元素,如果不是标准元素,那么更改成标准元素
如果要更改的元素等于当前要查找的元素,那么当前要查找元素的位置+1
然后跳转到上级,继续循环查找每一个元素,如果每一个元素都属于标准元素,直到满足要查找的元素,并且位置也是正确的为止,
如果碰到不符合标准的元素,那么继续更改成标准元素,如果元素不是要查找的元素,那么更改后,跳转后继续循环,如果要更改的元素与当前要查找的元素相同,那么位置+1,继续。。。。。。
反正思路比较乱,先按照上面的操作。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

1234

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-3-12 13:37 , Processed in 0.028680 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表