文件帮助中心文件
为文档添加语言标识符
UpdatedDocuments = AddLanguageTails(文档)
UpdatedDocuments = AddLanguageTails(文档,名称,值)
用addLanguageDetails要为文档添加语言标识符。
addLanguageDetails
该函数支持英语、日语、德语金宝app和韩语文本。
例子
更新= addlanguageTails(文件)检测语言文件并更新令牌详细信息。该函数仅将详细信息添加到具有丢失的语言详细信息的令牌。获取语言细节更新,使用令敬当。
更新= addlanguageTails(文件)
更新
文件
令敬当
更新= addlanguageTails(文件那名称,价值)使用一个或多个名称值对指定其他选项。
更新= addlanguageTails(文件那名称,价值)
名称,价值
提示
用addLanguageDetails在使用之前降低和上用作addLanguageDetails使用此功能删除的信息。
降低
上
全部收缩
通过将其拆分成一系列单词来手动标记一些文本。将手动标记的文本转换为一个tokenizedDocument通过设置的对象'tokenizemethod'选项'没有任何'。
tokenizedDocument
'tokenizemethod'
'没有任何'
str = split(“一句话的一个例子”)';文档=令人畏缩的document(str,'tokenizemethod'那'没有任何');
查看令牌详细信息令敬当。
Tdetails = tokendetails(文件)
tdetails =6×2表令牌DocumentNumber __________ ______________ " 一个“1”的例子“1”的“1”“1”短句子“1 1
当您指定时'tokenizemethod','没有',该函数不会自动检测文档的语言详细信息。要添加语言详细信息,请使用addLanguageDetails函数。默认情况下,该函数自动检测语言。
'tokenizemethod','没有'
文档= addlangugseTails(文件);
查看更新的令牌详细信息令敬当。
tdetails =6×4表令牌documentnumber类型语言__________ ______________________________“一个字母EN”示例“1字母en”的“1字母EN”A“1字母EN”简短“1字母EN”句子“1字母ZH
输入文档,指定为atokenizedDocument大批。
指定可选的逗号分离对名称,价值论点。姓名是参数名称和价值为对应值。姓名必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家。
姓名
价值
Name1, Value1,…,的家
'DiscardKnownValues',真实
'语'
'en'
'JA'
'de'
“柯”
语言,指定为下列一种:
'en'- - - - - -英语
'JA'- 日本人
'de'- 德国人
“柯”——韩国
如果未指定值,则该函数使用输入文本检测语言corpusLanguage函数。
corpusLanguage
此选项指定标记的语言细节。要查看标记的语言细节,请使用令敬当。这些语言详细信息决定了行为Removestopwords.那addPartOfSpeechDetails那正常化字那AddsentEnCentails., 和添加性达尔令牌上的函数。
Removestopwords.
addPartOfSpeechDetails
正常化字
AddsentEnCentails.
添加性达尔
有关文本分析工具箱™中语言支持的更多信息,请参阅金宝app语言考虑因素。
“DiscardKnownValues”
错误的
真正的
选项以丢弃先前计算的详细信息并重新编译,指定为真正的或错误的。
数据类型:逻辑
逻辑
更新的文件,返回A.tokenizedDocument大批。获取令牌细节更新,使用令敬当。
缩写|添加性达尔|添加性达尔|addlemmadetails.|addPartOfSpeechDetails|AddsentEnCentails.|addtypedetails.|corpusLanguage|诽谤|令敬当|tokenizedDocument|人持人群
缩写
addlemmadetails.
addtypedetails.
诽谤
人持人群
您有此示例的修改版本。您是否希望使用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室