文档帮助中心文档
从单词袋模型中删除低计数的单词
newBag = removeInfrequentWords(包,数量)
newBag = removeInfrequentWords(袋、计数、IgnoreCase,真的)
例子
newBag= removeInfrequentWords (袋,数)删除最多出现的单词数从词汇袋模型中得到的总时间袋.缺省情况下,该函数区分大小写。
newBag= removeInfrequentWords (袋,数)
newBag
袋
数
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)删除最多出现的单词数总次数忽略大小写。如果单词只按大小写不同,则合并相应的计数。
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)
全部折叠
从单词袋模型中删除出现两次或更少的单词。
从标记化文档数组创建单词袋模型。
文件= tokenizedDocument ([一个短句的例子第二个短句“另一个例子”“一个简短的例子”]);袋= bagOfWords(文档)
单词:["an" "a" "short"…NumWords: 8 NumDocuments: 4
数= 2;newBag = removeInfrequentWords(包,数量)
newBag = bagOfWords with properties: Counts: [4x3 double] Vocabulary: ["example" "a" "short"] NumWords: 3 NumDocuments: 4
bagOfWords
输入词袋模型,指定为bagOfWords对象。
计数阈值以删除字,指定为正整数。函数删除出现的单词数总次数或更少。
bagOfWords|bagOfNgrams|removeInfrequentNgrams|removeWords|removeEmptyDocuments|topkwords|tfidf|tokenizedDocument
bagOfNgrams
removeInfrequentNgrams
removeWords
removeEmptyDocuments
topkwords
tfidf
tokenizedDocument
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系