主要内容

删除InfrequentWords

从字袋模型中删除用低计数的单词

描述

例子

新袋= removeinfrequentwords(,,,,数数删除最多出现的单词数数总数范围的型号。默认情况下,该功能对情况敏感。

例子

新袋= removeinfrequentwords(,,,,数数,“ ignorecase”,true)删除最多出现的单词数数总共忽略案例。如果单词仅根据情况有所不同,则将相应的计数合并。

例子

全部收缩

从单词范围的型号中删除两次或更少的单词。

从一系列令牌化文档中创建一个单词型模型。

documents = tokenizedDocument([“简短句子的例子”“第二句话”“另一个例子”“一个简短的例子”);bag = bagofwords(文档)
bag =带有属性的bagofword:counts:[4x8 double]词汇:[“ an”“示例” of“ a” a“ a”“ short” ...] numwords:8 numdocuments:4

从单词袋模型中删除两次或更少的单词。

计数= 2;newbag = removeinfrequentwords(袋,计数)
newbag =带有属性的bagofword:counts:[4x3 double]词汇:[“示例”“ a”“ short”] numwords:3 numdocuments:4

输入参数

全部收缩

输入词袋型号,指定为小词目的。

计数阈值删除单词,指定为正整数。该功能删除了出现的单词数数总数或更少的时间。

版本历史记录

在R2017b中引入