主要内容

删除词

从文档或单词袋模型中删除简短的单词

描述

例子

新DOCUMENTS= removeshortWords(文件,,,,删除长度的单词或更少文件

例子

新袋= removeshortWords(,,,,删除长度的单词或更少小词目的

例子

全部收缩

用文档中的两个或更少的字符删除单词。

document = tokenizedDocument(“简短句子的例子”);newDocument = removeshortwords(文档,2)
newDocument = tokenizedDocument:3令牌:示例简短句子

从单词范围的型号中删除用两个或更少字符的单词。

documents = tokenizedDocument([...“简短句子的例子”“第二句话”);bag = bagofwords(文档);newbag = removeshortwords(袋子,2)
newbag =带有属性的bagofword:counts:[2x4 double]词汇:[“示例”“ short”句子“句子”“第二”] numwords:4 numdocuments:2

输入参数

全部收缩

输入文档,指定为象征性文档大批。

输入词袋型号,指定为小词目的。

要删除的最大单词长度,指定为正整数。该功能用或更少的字符。

输出参数

全部收缩

输出文档,返回象征性文档大批。

输出袋型号,返回小词目的。

版本历史记录

在R2017b中引入