停止单词
单词像“a”,“和”,“,”和“”(称为停止单词)可以向数据添加噪声。使用停止单词列表以帮助在分析之前创建要删除的自定义单词列表。
若要使用文档的语言细节从标记化文档中删除默认的停止词列表,请使用Removestopwords.
.若要从标记化文档中删除自定义单词列表,请使用删除
.
该函数返回英语,日语,德语和韩语停止单词列表。
bagOfNgrams
|bagOfWords
|normalizeWords
|removeLongWords
|removeShortWords
|Removestopwords.
|删除
|tokenizedDocument