Fedelement.

在HTML树中查找元素

折叠所有页面

语法

子树= FindElement（树，选择器）

描述

例子

子树= findElement (树，选择器)返回树匹配CSS选择器。

例子

全部折叠

在HTML树中查找元素

打开直播脚本

从URL读取HTML代码https://www.mathwands.com/help/textanalytics.使用webread函数。

url =“//www.tatmou.com/help/textanalytics”；代码= webread (url);

使用。解析HTML代码htmlTree．

树= htmlTree(代码);

查找使用HTML树中的所有超链接Fedelement.．超链接是带有元素名的节点“一种”．

选择器=“一种”；子树= findElement(树,选择器);

查看前几个子树。

子树(1:10)

ans = 10×1 htmltree：跳到内容    产品 金宝搏官方网站solutions   Academia  支持 社区  得到MATLAB

使用。从子树中提取文本extractHTMLText．结果包含页面上每个链接的链接文本。

str = extracthtmltext（子树）;str（1:10）

ans =10×1字符串“跳到内容”“”产品“”解决方案“”Acad下载188bet金宝搏emia“”支持“”社金宝搏官方网站区“”事件“”得到Matlab“”“金宝app

输入参数

全部折叠

`树`- - - - - -HTML树
标量`htmlTree`对象

HTML树，指定为标量htmlTree目的。

`选择器`- - - - - -CSS选择器
字符串标量|特征向量

CSS选择器，指定为字符串标量或字符向量。有关更多信息，请参见CSS选择器．

输出参数

全部折叠

`子树`—匹配HTML子树
`htmlTree`大批

匹配的HTML子树，返回为htmlTree数组中。

更多关于

全部折叠

HTML元素

一个典型的HTML元素包含以下组件:

Element name—HTML标记的名称。元素名对应于的名字属性。
属性 - 有关标记的其他信息。HTML属性具有表单的名字=“价值＂,在那里的名字和价值分别表示属性名和值。属性显示在开始的HTML标记中。要从HTML树中获取属性值，请使用getAttribute.．
Content—元素的内容。内容出现在打开和关闭HTML标记之间。内容可以是文本数据或嵌套的HTML元素。从…中提取文本htmlTree对象,使用extractHTMLText．对象的嵌套HTML元素htmlTree对象,使用孩子们财产。

例如，HTML元素 home 包括以下组件：

组件		价值	描述
元素名称		`一个`	元素是超链接
属性	属性名称	`href`	超链接引用
属性	属性值	`“//www.tatmou.com”`	超链接的参考价值
内容		`首页`	文本显示

CSS选择器

CSS选择器指定匹配树中的元素的模式。

这个表格展示了一些例子，展示了如何从HTML树中提取不同的HTML元素:

任务	CSS选择器	例子
找到所有段落(`< p >`)元素。	`“p”`	`findElement(树,“p”)`
找到所有段落(`< p >`)及列表项(`<李>`)元素。	`“p,李”`	`findElement(树,”李p”)`
找到所有段落(`< p >`)中的元素(`<表>`)元素。	`"表p "`	`FindElment（树，“表P”）`
查找所有超连结(`<一>`)元素的超链接引用属性(`href`）结尾的值`“.pdf”`．	`“(href = " . pdf”“美元)”`	`findelement（树，“A [HREF $ =”“。PDF”“”]“）`
找到所有段落(`< p >`)元素是其父元素的第一个子元素。	`“p:第一个孩子”`	`findElement (tr,“p:第一个孩子”)`
找到所有段落(`< p >`)元素，它们是父元素的第一段元素。	`“p: first-of-type”`	`FindElment（TR，“P：第一型”）`
找到所有的重点(`< em >`）父母是段落的元素（`< p >`)元素。	`“p > em”`	`findElement (tr,“p > em”)`
找到所有段落(`< p >`)元素紧接在标题1 (`<标题>`）元素	`“h1 + p”`	`findElement (tr, h1 + p)`
找到所有空元素。	`”:空”`	`FindElment（TR，“：空”）`
查找所有非空标签(`<标识>`)元素。	`”标签:不(空的):“`	`findElement (tr,“标签:不(空的):“)`

的Fedelement.函数支持所有的CS金宝appS级别3，除了选择器“朗:“，”:“检查，“：关联”，”:活跃”，”:徘徊”，”:焦点”，”:目标”，启用”:“，和禁用”:“．

有关CSS选择器的更多信息，请参见[1]．

参考

[1]CSS选择器参考．https://www.w3schools.com/cssref/css_selectors.asp

另请参阅

主题

介绍了R2018b

文本分析工具箱文档

金宝app

入门文本分析在MATLAB

立即下载

Fedelement.

语法

描述

例子

在HTML树中查找元素

输入参数

树- - - - - -HTML树标量htmlTree对象

选择器- - - - - -CSS选择器字符串标量|特征向量

输出参数

子树—匹配HTML子树htmlTree大批

更多关于

HTML元素

CSS选择器

参考

另请参阅

主题

文本分析工具箱文档

金宝app

入门文本分析在MATLAB

`树`- - - - - -HTML树
标量`htmlTree`对象

`选择器`- - - - - -CSS选择器
字符串标量|特征向量

`子树`—匹配HTML子树
`htmlTree`大批