从文档中删除停止词
像“a”、“and”、“to”和“the”这样的词(也就是停止词)会给数据增加干扰。使用此函数删除分析前的停止词。
该函数支持英语、日语、德语金宝app和韩语文本。学会如何使用removeStopWords
对于其他语言,请参阅语言的注意事项.
将停止的单词从newDocuments
= removeStopWords (文档
)tokenizedDocument
数组文档
.函数在默认情况下使用stopWords
功能根据语言细节文档
并且不区分大小写。
要删除自定义单词列表,请使用removeWords
函数。
属性指定的停止字列表中以大小写匹配的停止字newDocuments
= removeStopWords (文档
、“IgnoreCase”错误)stopWords
函数。
提示
使用removeStopWords
在使用之前normalizeWords
函数作为removeStopWords
使用被此函数删除的信息。
tokenizedDocument
|removeShortWords
|removeLongWords
|removeWords
|normalizeWords
|stopWords
|bagOfWords