文档帮助中心文档
从单词包模型中删除计数较低的单词
newBag=删除常用词(包、计数)
newBag=删除频繁的单词(bag、count、'IgnoreCase',true)
实例
纽巴格=删除不常用的单词(纸袋,计数)删除最多出现的单词计数从单词袋模型中获得的总次数纸袋. 默认情况下,该函数区分大小写。
纽巴格=删除不常用的单词(纸袋,计数)
纽巴格
纸袋
计数
纽巴格=删除不常用的单词(纸袋,计数,'IgnoreCase',正确)删除最多出现的单词计数忽略大小写的总次数。如果单词仅大小写不同,则合并相应的计数。
纽巴格=删除不常用的单词(纸袋,计数,'IgnoreCase',正确)
全部崩溃
从单词包模型中删除出现两次或更少的单词。
从标记化文档数组创建一个单词包模型。
文档=标记化文档([“一个短句的例子”“第二句话”“另一个例子”“一个简短的例子”]); bag=bagOfWords(文件)
bag=bagOfWords,属性:Counts:[4x8 double]词汇:[“a”short的“示例”…]NumWords:8 NumDocuments:4
从单词袋模型中删除出现两次或更少的单词。
计数=2;newBag=删除常用词(包、计数)
newBag=bagOfWords,属性:Counts:[4x3 double]词汇:[“示例”“a”“short”]NumWords:3 NumDocuments:4
巴格沃兹
输入单词包模型,指定为巴格沃兹对象
计数阈值以删除指定为正整数的单词。此函数用于删除出现的单词计数总次数或更少。
巴格沃兹|巴戈夫克|移除频繁的内存|移除词|删除空文档|托克沃兹|词频-逆向文件频率|标记化文档
巴戈夫克
移除频繁的内存
移除词
删除空文档
托克沃兹
词频-逆向文件频率
标记化文档
这是一个新版本。您是否同意修改合同?
与MATLAB公司通信的客户:
在介绍MATLAB公司的情况下,纳维加多尔网站并不赞赏MATLAB公司。
选择一个网站以获取翻译后的内容(如果可用),并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区站点不适合您所在位置的访问。
联系当地办事处