主要内容

removelongwords

从文档或单词袋模型中删除长词

描述

例子

新DOCUMENTS= removelongwords(文件,,,,删除长度的单词或更大文件

例子

新袋= removelongwords(,,,,删除长度的单词或从小词目的

例子

全部收缩

用文档中的七个或更高字符删除单词。

document = tokenizedDocument(“简短句子的例子”);newDocument = removelongwords(文档,7)
newDocument = tokenizedDocument:4令牌:一个简短的

从单词袋模型中删除用七个或更高字符的单词。

documents = tokenizedDocument([...“简短句子的例子”“第二句话”);bag = bagofwords(文档);newbag = removelongwords(袋子,7)
newbag =带有属性的bagofwords:counts:[2x5 double]词汇:[“ an”“”“”“ a”“ short”“ second”] numwords:5 numdocuments:2

输入参数

全部收缩

输入文档,指定为象征性文档大批。

输入词袋型号,指定为小词目的。

删除的最小单词长度,指定为正整数。该功能用或更大的字符。

输出参数

全部收缩

输出文档,返回象征性文档大批。

输出袋型号,返回小词目的。

版本历史记录

在R2017b中引入