主要内容

删除录制

从单词袋或n-grams模型中删除文档

描述

例子

新手= recouptocument(idx.的)使用指定的指标删除文件idx.来自单词袋或袋式袋模型。如果删除的文档包含剩余文档中未出现的单词或n-gram,则该函数还会从中删除这些单词或n-grams

例子

全部收缩

从单词袋式模型中删除所选文档。

文档= tokenizeddocument([......“一句话的一个例子”“第二句话”“第三个例子”“最后一句话”]);袋= bagofwords(文件)
BAG = BAGOFWORDS具有属性:计数:[4x9 DOUBLE]词汇表:[“示例”“A”“短语”......] NUM字:9 NUMFOCUMENTS:4

删除第一个和第三个文件

Idx = [1 3];newbag = recount(bag,Idx)
newbag = bagofwords的属性:counts:[2x5 double]词汇表:[“短”“句子”“第二”“最终”] numwords:5 numfocuments:2

使用逻辑索引删除相同的文档。

idx =逻辑([1 0 1 0]);newbag = recount(bag,Idx)
newbag = bagofwords的属性:counts:[2x5 double]词汇表:[“短”“句子”“第二”“最终”] numwords:5 numfocuments:2

输入参数

全部收缩

输入袋式或n-grams模型,指定为aBagofwords.对象或A.Bagofngrams.目的。

要删除的文档指标,指定为数字索引的向量或逻辑指数的向量。

例子:[2 4 6]

例子:[0 1 0 1 0 1]

输出参数

全部收缩

输出模型,作为a返回Bagofwords.对象或A.Bagofngrams.目的。类型的类型新手与类型相同

介绍在R2017B.