removeinfrequentwords.

从单词袋式模型中删除具有低计数的单词

页面上倒塌

句法

newbag = removeinfrequentwords（袋，计数）

newbag = removeinfrequentwords（袋，计数，'Ignorecase'，true）

新手= removeinfrequentwords（包那数数）删除最多出现的单词数数总共袋式模型的时间包。默认情况下，该函数区分大小写。

新手= removeinfrequentwords（包那数数，'Ignorecase'，True）删除最多出现的单词数数总忽略案例的时间。如果单词仅逐个不同，则相应的计数是合并的。

打开直播脚本

从单词袋式模型中删除出现两次或更少的单词。

从令牌文档数组创建一个单词袋式模型。

文档= tokenizeddocument（[“一句话的一个例子”“第二句话”“另一个例子”“一个很短的例子”]）;BAG = BAGOFWORDS（文件）

BAG =具有属性的Bagofwords：Counts：[4x8 Double]词汇：[1x8字符串] numwords：8 numfocuments：4

删除从单词袋模型中显示两次或更少的单词。

count = 2;newbag = removeinfrequentwords（袋，计数）

newbag = bagofwords的属性：counts：[4x3 double]词汇：[示例“”shittle“] numwords：3 numfocuments：4

输入袋式模型，指定为aBagofwords.目的。

计算阈值以删除单词，指定为正整数。该函数删除出现的单词数数总计或更少的时间。

在R2017B中介绍

现在下载