文档帮助中心文档
读取HTML树根节点的HTML属性
str = getAttribute(树,attr)
例子
str= getAttribute (树,attr)返回属性attr的根结点树.如果未设置该属性,则函数返回失踪价值。
str= getAttribute (树,attr)
str
树
attr
失踪
全部折叠
从URL读取HTML代码//www.tatmou.com/help/textanalytics使用webread.
//www.tatmou.com/help/textanalytics
webread
url =“//www.tatmou.com/help/textanalytics”;代码= webread (url);
使用。解析HTML代码htmlTree.
htmlTree
树= htmlTree(代码);
使用。查找HTML树中的所有超链接findElement.超链接是具有元素名的节点“一个”.
findElement
“一个”
选择器=“一个”;子树= findElement(树,选择器);子树(1:10)
ans = 10×1 htmlTree:< class = " svg_link navbar-brand " href = " //www.tatmou.com?s_tid=gn_logo " > < IMG alt = " MathWorks " class = " mw_logo " src = " /图片/响应全球/ pic-header-mathworks-logo.svg " / > < / > < class = " mwa-nav_login " href = " //www.tatmou.com/login?uri=http: / / www.tatmou.com/help/textanalytics/index.html " >在< / > <迹象产品href = " https://www.mathworks下载188bet金宝搏.com/products.html?s_tid=gn_ps " > < / > < A href = " https://www.mathworks金宝搏官方网站.com/solutions.html?s_tid=gn_sol " >解决方案< / > < A href = " //www.tatmou.com/academia.html?s_tid=gn_acad " >学术界< / > < A href = "金宝app //www.tatmou.com/support.html?s_tid=gn_supp " > < / > <支持社区href = " //www.tatmou.com/matlabcentral/?s_tid=gn_mlc " > < / > < A href = " //www.tatmou.com/company/events.html?s_tid=gn_ev " >事件< / > < A href = " //www.tatmou.com/company/aboutus/contact_us.html?s_tid=gn_cntus " >联系我们< / > < A href = " //www.tatmou.com/store?s_cid=store_top_nav& s_tid = gn_store " >如何购买< / >
使用getAttribute.指定属性名称“href”.
getAttribute
“href”
attr =“href”;str = getAttribute(子树,attr);str (1:10)
ans =10×1的字符串数组"//www.tatmou.com?s_tid=gn_logo" "//www.tatmou.com/login?uri=//www.tatmou.com/help/textanalytics/index.html" "//www.tatmou.com/下载188bet金宝搏products.html?s_tid=gn_ps" "//www.tatmou.com/金宝搏官方网站solutions.html?s_tid=gn_sol" "//www.tatmou.com/academia.html?s_tid=gn_acad"“//www.tatmou.com/金宝appsupport.html?s_tid=gn_supp”“//www.tatmou.com/matlabcentral/?s_tid=gn_mlc”“//www.tatmou.com/company/events.html?s_tid=gn_ev”“//www.tatmou.com/company/aboutus/contact_us.html?s_tid=gn_cntus”“//www.tatmou.com/store?s_cid=store_top_nav&s_tid=gn_store”
HTML树,指定为htmlTree数组中。
属性名,指定为字符串标量、字符向量或包含字符向量的标量单元数组。
属性,以字符串数组的形式返回
一个典型的HTML元素包含以下组件:
Element name—HTML标记的名称。元素名对应于的名字属性。
的名字
属性-关于标签的附加信息。HTML属性具有表单的名字= "价值",在那里的名字和价值分别表示属性名和值。属性显示在开始的HTML标记中。要从HTML树中获取属性值,请使用getAttribute.
的名字= "价值"
价值
Content—元素的内容。内容出现在打开和关闭HTML标记之间。内容可以是文本数据或嵌套的HTML元素。从…中提取文本htmlTree对象,使用extractHTMLText.对象的嵌套HTML元素htmlTree对象,使用孩子们财产。
extractHTMLText
孩子们
例如,HTML元素回家的< a href = " //www.tatmou.com " > < / >由以下组件组成:
回家的< a href = " //www.tatmou.com " > < / >
一个
href
“//www.tatmou.com”
首页
extractFileText|extractHTMLText|readPDFFormData|htmlTree|findElement|ismissing|tokenizedDocument
extractFileText
readPDFFormData
ismissing
tokenizedDocument
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系