主要内容

removeLongWords

从文件或删除长单词bag-of-words模型

描述

例子

newDocuments= removeLongWords (文档,len)删除单词的长度len或更大文档

例子

newBag= removeLongWords (,len)删除单词的长度len或更高的bagOfWords对象

例子

全部折叠

把单词与七个或更多字符从一个文档。

文档= tokenizedDocument (“一个短句”);newDocument = removeLongWords(文档,7)
newDocument = tokenizedDocument: 4标记:一个短的

把单词与七个或更多字符从bag-of-words模型。

文件= tokenizedDocument ([“一个短句”“第二个短句”]);袋= bagOfWords(文件);newBag = removeLongWords(包,7)
newBag = bagOfWords属性:计数:[2 x5双]词汇:[“““““““短”“第二”)NumWords: 5 NumDocuments: 2

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

输入bag-of-words模型,指定为一个bagOfWords对象。

最小长度的单词删除指定为一个正整数。该函数删除的话len或更大的字符。

输出参数

全部折叠

输出文件,作为一个返回tokenizedDocument数组中。

输出bag-of-words模型,作为一个返回bagOfWords对象。

介绍了R2017b