文档帮助中心
从文本中删除HTML和XML标签
=中newstr eraseTags(STR)
例
中newstr= eraseTags(海峡)擦除HTML和的元素XML注释和标记海峡。
中newstr= eraseTags(海峡)
中newstr
海峡
该功能将删除评论和标签与标签名称一种,简称,缩写,b,BDI,BDO,大,码,德尔,DFN,EM,字形,一世,插件,大骨节病,标记,RP,RT,红宝石,小号,小,跨度,罢工,强大子,SUP,TT,ü,VAR和WBR,并取代所有其他的标签与空间。
一种
简称
缩写
b
BDI
BDO
大
码
德尔
DFN
EM
字形
一世
插件
大骨节病
标记
RP
RT
红宝石
小号
小
跨度
罢工
强大
子
SUP
TT
ü
VAR
WBR
该功能不会删除HTML和XML元素(标签开始和结束标记之间以及东西)。例如,eraseTags( “ן”)返回字符串“XY”。它不仅能消除标签和,并且不除去该元素ÿ。
eraseTags( “ן”)
“XY”
ÿ
全部收缩
删除一些HTML代码的标签。该函数替换点击标签用空格。
点击
htmlCode =“一个。结果两个”;=中newstr eraseTags(htmlCode)
=中newstr “之一。两个”
删除一些XML代码的标签。该功能可除去<子>标签和不带空格替换它们。
<子>
xmlCode =“H <子> 2 子> O” 的;=中newstr eraseTags(xmlCode)
中newstr = “H 2 O”
输入文本,指定为一个字符串数组,字符向量,或字符向量的单元阵列。
例:[“短句子的一个例子。”;“第二短句子”。]
[“短句子的一个例子。”;“第二短句子”。]
数据类型:串|烧焦|细胞
串
烧焦
细胞
输出文本,返回作为一个字符串数组,字符向量,或字符向量的单元阵列。海峡和中newstr具有相同的数据类型。
decodeHTMLEntities|erasePunctuation|eraseURLs|降低|tokenizedDocument|上
decodeHTMLEntities
erasePunctuation
eraseURLs
降低
tokenizedDocument
上
这个例子的修改版本的系统上存在。你要打开这个版本呢?
您单击对应于该MATLAB命令的链接:
在MATLAB命令窗口中输入它运行的命令。Web浏览器不支持MATLAB的命令。金宝app
选择一个网站,以获得翻译的内容,其中可看到当地的活动和优惠。根据您的位置,我们建议您选择:。
您还可以选择从下面的列表中的网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。
请联系您当地的办事处