帮助中心帮助中心
从字袋模型中删除用低计数的单词
newbag = removeinfrequentwords(袋,计数)
newbag = removeinfrequentwords(袋,计数,'ignorecase',true)
例子
新袋= removeinfrequentwords(包,,,,数数)删除最多出现的单词数数总数范围的型号包。默认情况下,该功能对情况敏感。
新袋= removeinfrequentwords(包,,,,数数)
新袋
包
数数
新袋= removeinfrequentwords(包,,,,数数,“ ignorecase”,true)删除最多出现的单词数数总共忽略案例。如果单词仅根据情况有所不同,则将相应的计数合并。
新袋= removeinfrequentwords(包,,,,数数,“ ignorecase”,true)
全部收缩
从单词范围的型号中删除两次或更少的单词。
从一系列令牌化文档中创建一个单词型模型。
documents = tokenizedDocument([“简短句子的例子”“第二句话”“另一个例子”“一个简短的例子”);bag = bagofwords(文档)
bag =带有属性的bagofword:counts:[4x8 double]词汇:[“ an”“示例” of“ a” a“ a”“ short” ...] numwords:8 numdocuments:4
从单词袋模型中删除两次或更少的单词。
计数= 2;newbag = removeinfrequentwords(袋,计数)
newbag =带有属性的bagofword:counts:[4x3 double]词汇:[“示例”“ a”“ short”] numwords:3 numdocuments:4
小词
输入词袋型号,指定为小词目的。
计数阈值删除单词,指定为正整数。该功能删除了出现的单词数数总数或更少的时间。
小词|Bagofngrams|删除ininfrequentngram|删除字|remove emptimentDocuments|topkwords|TFIDF|象征性文档
Bagofngrams
删除ininfrequentngram
删除字
remove emptimentDocuments
topkwords
TFIDF
象征性文档
您有此示例的修改版本。您想用您的编辑打开这个示例吗?
您单击了与此MATLAB命令相对应的链接:
通过在MATLAB命令窗口中输入该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站以获取可用的翻译内容,并查看本地事件和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英语)以获得最佳场地性能。其他Mathworks乡村网站未针对您所在的访问进行优化。
联系您当地的办公室