文本分析工具箱™支持英语,日语,德语和韩语。金宝app大多数文本分析工具箱功能也与其他语言的文本。下表总结了如何使用文本分析工具箱功能的其他语言。
特征 | 语言的思考 | 解决方法 |
---|---|---|
符号化 | 这 |
对于其他语言,您仍然可以尝试使用 有关更多信息,请参阅 |
停止词删除 | 这 |
若要从其他语言,使用的停止词 |
句子检测 | 这 |
对于其他语言,你可能需要指定你自己的缩写句检测的名单。为此,使用 有关更多信息,请参阅 |
字云 | 对于字符串输入时, |
对于其他语言,您可能需要手动的进行预处理的文本数据,并指定唯一的单词和相应的尺寸 要指定字长的 有关更多信息,请参阅 |
Word中的嵌入 | 文件输入到 |
对于含有非英文文本文件,则可能需要输入 要创建 有关更多信息,请参阅 |
关键字提取 | 这 |
这 对于其他语言,指定一个合适的组使用分隔符 有关更多信息,请参阅 |
这 |
这 对于其他语言,请尝试使用 有关更多信息,请参阅 |
这Bagofwords.
和bagOfNgrams
功能支持金宝apptokenizedDocument
输入语言无关。如果你有一个tokenizedDocument
数组中包含您的数据,然后您可以使用这些函数。
这菲达
和fitlsa
功能支持金宝appBagofwords.
和bagOfNgrams
输入语言无关。如果你有一个Bagofwords.
或bagOfNgrams
对象包含数据,那么你可以使用这些功能。
这trainWordEmbedding
功能支持金宝apptokenizedDocument
或文件输入语言无关。如果你有一个tokenizedDocument
数组或包含在正确格式的数据文件,那么你可以使用此功能。
[1]Unicode文本分割。https://www.unicode.org/reports/tr29/
[3]仲裁处:然而,部分的词性和词法分析器的另一。https://taku910.github.io/mecab/
停用词
|removeWords
|正常化字
|Bagofwords.
|bagOfNgrams
|tokenizedDocument
|菲达
|fitlsa
|WordCloud.
|AddsentEnCentails.
|addLanguageDetails