erasePunctuation
从文本和文档中删除标点符号
语法
描述
从中删除标点和符号newDocuments
= erasePunctuation (文档
)文档
.如果一个单词在删除标点符号和符号字符后为空,那么函数将删除它。对于标记化的文档输入,该函数从带有type的符号中删除标点符号“标点符号”
和“其他”
.例如,该函数不会删除url和电子邮件地址中的标点和符号字符。
仅从指定的标记类型中擦除标点符号和符号。newDocuments
= erasePunctuation (文档
“TokenTypes”,类型
)
例子
输入参数
输出参数
更多关于
提示
字符串输入,
erasePunctuation
从url和HTML标签中删除标点字符。这种行为会阻止功能eraseTags
,eraseURLs
,decodeHTMLEntities
按预期工作。如果您想使用这些函数对文本进行预处理,那么在使用之前使用这些函数erasePunctuation
.
兼容性的考虑
参考文献
[1]Unicode字符类别.https://www.fileformat.info/info/unicode/category/index.htm
介绍了R2017b