主要内容

Fedelement.

在HTML树中查找元素

描述

例子

子树= findElement (选择器)返回匹配CSS选择器。

例子

全部折叠

从URL读取HTML代码https://www.mathwands.com/help/textanalytics.使用webread函数。

url =“//www.tatmou.com/help/textanalytics”;代码= webread (url);

使用。解析HTML代码htmlTree

树= htmlTree(代码);

查找使用HTML树中的所有超链接Fedelement..超链接是带有元素名的节点“一种”

选择器=“一种”;子树= findElement(树,选择器);

查看前几个子树。

子树(1:10)

使用。从子树中提取文本extractHTMLText.结果包含页面上每个链接的链接文本。

str = extracthtmltext(子树);str(1:10)
ans =10×1字符串“跳到内容”“”产品“”解决方案“”Acad下载188bet金宝搏emia“”支持“”社金宝搏官方网站区“”事件“”得到Matlab“”“金宝app

输入参数

全部折叠

HTML树,指定为标量htmlTree目的。

CSS选择器,指定为字符串标量或字符向量。有关更多信息,请参见CSS选择器

输出参数

全部折叠

匹配的HTML子树,返回为htmlTree数组中。

更多关于

全部折叠

HTML元素

一个典型的HTML元素包含以下组件:

  • Element name—HTML标记的名称。元素名对应于的名字属性。

  • 属性 - 有关标记的其他信息。HTML属性具有表单的名字=“价值,在那里的名字价值分别表示属性名和值。属性显示在开始的HTML标记中。要从HTML树中获取属性值,请使用getAttribute.

  • Content—元素的内容。内容出现在打开和关闭HTML标记之间。内容可以是文本数据或嵌套的HTML元素。从…中提取文本htmlTree对象,使用extractHTMLText.对象的嵌套HTML元素htmlTree对象,使用孩子们财产。

例如,HTML元素 home 包括以下组件:

组件 价值 描述
元素名称 一个 元素是超链接
属性 属性名称 href 超链接引用
属性值 “//www.tatmou.com” 超链接的参考价值
内容 首页 文本显示

CSS选择器

CSS选择器指定匹配树中的元素的模式。

这个表格展示了一些例子,展示了如何从HTML树中提取不同的HTML元素:

任务 CSS选择器 例子
找到所有段落(< p >)元素。 “p” findElement(树,“p”)
找到所有段落(< p >)及列表项(<李>)元素。 “p,李” findElement(树,”李p”)
找到所有段落(< p >)中的元素(<表>)元素。 "表p " FindElment(树,“表P”)
查找所有超连结(<一>)元素的超链接引用属性(href)结尾的值“.pdf” “(href = " . pdf”“美元)” findelement(树,“A [HREF $ =”“。PDF”“”]“)
找到所有段落(< p >)元素是其父元素的第一个子元素。 “p:第一个孩子” findElement (tr,“p:第一个孩子”)
找到所有段落(< p >)元素,它们是父元素的第一段元素。 “p: first-of-type” FindElment(TR,“P:第一型”)
找到所有的重点(< em >)父母是段落的元素(< p >)元素。 “p > em” findElement (tr,“p > em”)
找到所有段落(< p >)元素紧接在标题1 (<标题>) 元素 “h1 + p” findElement (tr, h1 + p)
找到所有空元素。 ”:空” FindElment(TR,“:空”)
查找所有非空标签(<标识>)元素。 ”标签:不(空的):“ findElement (tr,“标签:不(空的):“)

Fedelement.函数支持所有的CS金宝appS级别3,除了选择器“朗:“”:“检查“:关联””:活跃””:徘徊””:焦点””:目标”启用”:“, 和禁用”:“

有关CSS选择器的更多信息,请参见[1]

介绍了R2018b