主要内容

removeinfrequentwords.

从单词袋式模型中删除具有低计数的单词

描述

例子

新手= removeinfrequentwords(数数删除最多出现的单词数数总共袋式模型的时间。默认情况下,该函数区分大小写。

例子

新手= removeinfrequentwords(数数,'Ignorecase',True)删除最多出现的单词数数总忽略案例的时间。如果单词仅逐个不同,则相应的计数是合并的。

例子

全部收缩

从单词袋式模型中删除出现两次或更少的单词。

从令牌文档数组创建一个单词袋式模型。

文档= tokenizeddocument([“一句话的一个例子”“第二句话”“另一个例子”“一个很短的例子”]);BAG = BAGOFWORDS(文件)
BAG =具有属性的Bagofwords:Counts:[4x8 Double]词汇:[1x8字符串] numwords:8 numfocuments:4

删除从单词袋模型中显示两次或更少的单词。

count = 2;newbag = removeinfrequentwords(袋,计数)
newbag = bagofwords的属性:counts:[4x3 double]词汇:[示例“”shittle“] numwords:3 numfocuments:4

输入参数

全部收缩

输入袋式模型,指定为aBagofwords.目的。

计算阈值以删除单词,指定为正整数。该函数删除出现的单词数数总计或更少的时间。

在R2017B中介绍