主要内容

addLanguageDetails

为文档添加语言标识符

描述

addLanguageDetails要为文档添加语言标识符。

该函数支持英语、日语、德语金宝app和韩语文本。

例子

更新= addlanguageTails(文件检测语言文件并更新令牌详细信息。该函数仅将详细信息添加到具有丢失的语言详细信息的令牌。获取语​​言细节更新,使用令敬当

更新= addlanguageTails(文件名称,价值使用一个或多个名称值对指定其他选项。

提示

addLanguageDetails在使用之前降低用作addLanguageDetails使用此功能删除的信息。

例子

全部收缩

通过将其拆分成一系列单词来手动标记一些文本。将手动标记的文本转换为一个tokenizedDocument通过设置的对象'tokenizemethod'选项'没有任何'

str = split(“一句话的一个例子”)';文档=令人畏缩的document(str,'tokenizemethod''没有任何');

查看令牌详细信息令敬当

Tdetails = tokendetails(文件)
tdetails =6×2表令牌DocumentNumber  __________ ______________ " 一个“1”的例子“1”的“1”“1”短句子“1 1

当您指定时'tokenizemethod','没有',该函数不会自动检测文档的语言详细信息。要添加语言详细信息,请使用addLanguageDetails函数。默认情况下,该函数自动检测语言。

文档= addlangugseTails(文件);

查看更新的令牌详细信息令敬当

Tdetails = tokendetails(文件)
tdetails =6×4表令牌documentnumber类型语言__________ ______________________________“一个字母EN”示例“1字母en”的“1字母EN”A“1字母EN”简短“1字母EN”句子“1字母ZH

输入参数

全部收缩

输入文档,指定为atokenizedDocument大批。

名称值对参数

指定可选的逗号分离对名称,价值论点。姓名是参数名称和价值为对应值。姓名必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:'DiscardKnownValues',真实指定放弃先前计算的详细信息并重新计算它们。

语言,指定为下列一种:

  • 'en'- - - - - -英语

  • 'JA'- 日本人

  • 'de'- 德国人

  • “柯”——韩国

如果未指定值,则该函数使用输入文本检测语言corpusLanguage函数。

此选项指定标记的语言细节。要查看标记的语言细节,请使用令敬当这些语言详细信息决定了行为Removestopwords.addPartOfSpeechDetails正常化字AddsentEnCentails., 和添加性达尔令牌上的函数。

有关文本分析工具箱™中语言支持的更多信息,请参阅金宝app语言考虑因素

选项以丢弃先前计算的详细信息并重新编译,指定为真正的错误的

数据类型:逻辑

输出参数

全部收缩

更新的文件,返回A.tokenizedDocument大批。获取令牌细节更新,使用令敬当

在R2018B中介绍