语言的特性
单词和N-Gram计数
的bagOfWords
而且bagOfNgrams
功能的支持金宝apptokenizedDocument
不考虑语言的输入。如果你有tokenizedDocument
数组包含您的数据,然后您可以使用这些函数。
建模与预测
的fitlda
而且fitlsa
功能的支持金宝appbagOfWords
而且bagOfNgrams
不考虑语言的输入。如果你有bagOfWords
或bagOfNgrams
对象,然后可以使用这些函数。
的trainWordEmbedding
功能支持金宝apptokenizedDocument
或文件输入,而不考虑语言。如果你有tokenizedDocument
数组或包含正确格式的数据的文件,则可以使用此函数。
另请参阅
stopWords
|removeWords
|normalizeWords
|bagOfWords
|bagOfNgrams
|tokenizedDocument
|fitlda
|fitlsa
|wordcloud
|addSentenceDetails
|addLanguageDetails