normalizeWords
茎或lemmatize单词
语法
描述
使用normalizeWords
减少单词根形式。来lemmatize英语单词(减少他们的字典形式),设置“风格”
选项“引理”
。
函数支持英语、日语、德语,金宝app和韩国的文本。
减少了单词updatedDocuments
= normalizeWords (文档
)文档
一个根形式。英语和德语文本的函数,默认情况下,茎的单词使用波特抽梗机分别为英语和德语文本。对于日本和韩国文字,函数,默认情况下,lemmatizes使用MeCab记号赋予器的话。
减少字符串数组中的每个单词updatedWords
= normalizeWords (单词
)单词
一个根形式。
减少了单词和还指定了这个词的语言。updatedWords
= normalizeWords (单词
“语言”,语言
)