ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 10634|回复: 14

[转帖] Tags (网页标签)大全(按功能分类)_附:标签浏览的小工具

[复制链接]

TA的精华主题

TA的得分主题

发表于 2012-11-16 14:52 | 显示全部楼层 |阅读模式
本帖最后由 引子玄 于 2012-12-26 20:06 编辑

网页抓取,不管你使用哪种对象,都离不开网页分析。
而网页分析的基础,是Tags (网页标签)。现从W3school 节选如下,以便于翻找和阅读。


按功能类别排列
DTD:指示在哪种 XHTML 1.0 DTD 中允许该标签。S=Strict, T=Transitional, F=Frameset.
标签描述DTD
<!DOCTYPE> 定义文档类型。STF
<html>定义 HTML 文档。STF
<body>定义文档的主体。STF
<h1> to <h6>定义 HTML 标题。STF
<p>定义段落。STF
<br>定义简单的折行。STF
<hr>定义水平线。STF
<!--...-->定义注释。STF
标签描述DTD
<b>定义粗体文本。STF
<i>定义斜体文本。STF
<big>定义大号文本。STF
<small>定义小号文本。STF
<tt>定义打字机文本。STF
<kbd>定义键盘文本。STF
<var>定义文本的变量部分。STF
<dfn>定义定义项目。STF
<samp>定义计算机代码样本。STF
<xmp>不赞成使用。定义预格式文本。
标签描述DTD
<cite>定义引用(citation)。STF
<ins>定义被插入文本。STF
<del>定义被删除文本。STF
<s>不赞成使用。定义加删除线的文本。TF
<strike>不赞成使用。定义加删除线的文本。TF
标签描述DTD
<a>定义锚。STF
<link>定义文档与外部资源的关系。STF
标签描述DTD
<frame>定义框架集的窗口或框架。F
<frameset>定义框架集。F
<noframes>定义针对不支持框架的用户的替代内容。TF
<iframe>定义内联框架。TF
标签描述DTD
<form>定义供用户输入的 HTML 表单。STF
<input>定义输入控件。STF
<textarea>定义多行的文本输入控件。STF
<button>定义按钮。STF
<select>定义选择列表(下拉列表)。STF
<optgroup>定义选择列表中相关选项的组合。STF
<option>定义选择列表中的选项。STF
<label>定义 input 元素的标注。STF
<fieldset>定义围绕表单中元素的边框。STF
<legend>定义 fieldset 元素的标题。STF
<isindex>不赞成使用。定义与文档相关的可搜索索引。TF
标签描述DTD
<ul>定义无序列表。STF
<ol>定义有序列表。STF
<li>定义列表的项目。STF
<dir>不赞成使用。定义目录列表。TF
<dl>定义定义列表。STF
<dt>定义定义列表中的项目。STF
<dd>定义定义列表中项目的描述。STF
<menu>不赞成使用。定义菜单列表。TF
标签描述DTD
<img>定义图像。STF
<map>定义图像映射。STF
<area>定义图像地图内部的区域。STF
标签描述DTD
<table>定义表格STF
<caption>定义表格标题。STF
<th>定义表格中的表头单元格。STF
<tr>定义表格中的行。STF
<td>定义表格中的单元。STF
<thead>定义表格中的表头内容。STF
<tbody>定义表格中的主体内容。STF
<tfoot>定义表格中的表注内容(脚注)。STF
<col>定义表格中一个或多个列的属性值。STF
<colgroup>定义表格中供格式化的列组。STF
标签描述DTD
<style>定义文档的样式信息。STF
<div>定义文档中的节。STF
<span>定义文档中的节。STF
标签描述DTD
<head>定义关于文档的信息。STF
<title>定义文档的标题。STF
<meta>定义关于 HTML 文档的元信息。STF
<base>定义页面中所有链接的默认地址或默认目标。STF
<basefont>不赞成使用。定义页面中文本的默认字体、颜色或尺寸。TF
标签描述DTD
<script>定义客户端脚本。STF
<noscript>定义针对不支持客户端脚本的用户的替代内容。STF
<applet>不赞成使用。定义嵌入的 applet。TF
<object>定义嵌入的对象。STF
<param>定义对象的参数。STF

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-11-16 14:58 | 显示全部楼层
本帖最后由 引子玄 于 2012-12-26 14:16 编辑

Tags:
1、本身有各种各样的使用属性(比如:文本如TEXT、悬浮文本如TITLE、路径如HREF、操作值如VALUE、窗体如CLICK等等);
2、有同级的分类如getElementById、getElementsByName() 、 getElementsByTagName()等(用于交叉提取)
3、有上司对象如parentElement等
3、有下级对象如children、childNodes等

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2012-12-12 23:37 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-12-16 22:13 | 显示全部楼层
本帖最后由 引子玄 于 2012-12-26 14:03 编辑

Sub 文档与标签浏览小工具()

    With CreateObject("InternetExplorer.Application")
        .Visible = False
        .Navigate "http://www.hao123.com"
        Do Until .ReadyState = 4
            DoEvents
        Loop
      
      MsgBox "文档大集合的个数" & .Document.all.Length
      MsgBox "第1个文本" & vbCrLf & .Document.all(0).outerhtml
      MsgBox "最后一个文本" & vbCrLf & .Document.all(.Document.all.Length - 1).outerhtml
      MsgBox "层叠样式表个数" & .Document.all.tags("CSS").Length
      MsgBox "框架个数" & .Document.all.tags("frame").Length
      MsgBox "表格个数" & .Document.all.tags("table").Length
      MsgBox "形状个数" & .Document.all.tags("form").Length
      MsgBox "现在开始浏览已有标签的个数"
    ' MsgBox .Document.Forms(0).all(Index).innertext
    ' MsgBox .Document.Forms(1).all(Index).outerhtml
    ' MsgBox .Document.Forms(2).all(Index).innertext
     
        arr = Split("标签号,a,abbr,acronym,address,applet,area,b,base,basefont,bdo,big,blockquote,body,br,button,caption,center,cite,code,col,colgroup,dd,del,dfn,dir,div,dl,dt,em,fieldset,font,form,frame,frameset,head,h1,h2,h3,h4,h5,h6,hr,html,i,iframe,img,input,ins,kbd,label,legend,li,link,map,menu,meta,noframes,noscript,object,ol,optgroup,option,p,param,pre,q,s,samp,script,select,small,span,strike,strong,style,sub,sup,table,tbody,td,textarea,tfoot,th,thead,title,tr,tt,u,ul,var", ",")
        
        For i = 1 To UBound(arr)
        w = arr(i)
        If .Document.all.tags(w).Length > 0 Then
        T = Timer
        Application.StatusBar = w & "标签个数" & .Document.all.tags(w).Length
        
        Do Until Timer > T + 1    '等待
            DoEvents
        Loop                      '等待
        End If
        Next
        Application.StatusBar = False
递归:
        TT = InputBox("请输入标签:", "提示:不输入按[确定]退出")
          If TT <> "" Then
          MsgBox TT & "标签个数" & .Document.all.tags(TT).Length
            If .Document.all.tags(TT).Length > 0 Then
              For i = 0 To .Document.all.tags(TT).Length - 1
                  Set WshShell = CreateObject("Wscript.Shell")
            WshShell.Popup TT & "标签第" & i & "位的文本: " & vbCrLf & .Document.all.tags(TT)(i).outerhtml, 1, "请等待1秒钟,1秒后该窗口自动关闭"
              Next
            End If
          End If
        If TT <> "" Then GoTo 递归
        
        .Quit
    End With
End Sub


评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2013-3-24 01:22 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2013-6-8 10:38 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
绝对的好帖,怎么没人顶

TA的精华主题

TA的得分主题

发表于 2013-6-8 23:52 | 显示全部楼层
好,先做个笔记,用时来翻

TA的精华主题

TA的得分主题

发表于 2013-10-17 20:55 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
确实好帖!!!顶!

TA的精华主题

TA的得分主题

发表于 2014-6-27 04:39 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-12-6 18:45 | 显示全部楼层
引子玄 发表于 2012-11-16 14:58
Tags:
1、本身有各种各样的使用属性(比如:文本如TEXT、悬浮文本如TITLE、路径如HREF、操作值如VALUE、窗 ...

Mark一下。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 08:52 , Processed in 0.058377 second(s), 15 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表