主要内容

addTypeDetails

向文档添加令牌类型细节

描述

例子

updatedDocuments= addTypeDetails (文档中检测令牌类型文档并更新令牌细节。该函数只向类型未知的标记添加类型细节。来获取令牌类型updatedDocuments,使用tokenDetails

例子

updatedDocuments= addTypeDetails (文档名称,值使用一个或多个名称-值对指定其他选项。

提示

使用addTypeDetails在使用之前较低的,erasePunctuation函数作为addTypeDetails使用被这些函数删除的信息。

例子

全部折叠

将手动标记文本转换为tokenizedDocument对象,设置“TokenizeMethod”选项“没有”

str = [“对”“更多”“信息””、““看到”“//www.tatmou.com”“。”];文件= tokenizedDocument (str,“TokenizeMethod”“没有”
documents = tokenizedDocument: 7 token:更多信息,请参见//www.tatmou.com。

属性查看令牌的详细信息tokenDetails函数。

tdetails = tokenDetails(文档)
tdetails =7×2表令牌DocumentNumber  ___________________________ ______________ " “1”更多信息“1”“1”,“1”看到“1 " //www.tatmou.com " 1 "。”1

如果你设置“TokenizeMethod”“没有”在电话中tokenizedDocument函数,则它不检测标记的类型。要添加令牌类型详细信息,请使用addTypeDetails函数。

= addTypeDetails文件(文档);

查看更新后的令牌详细信息。

tdetails = tokenDetails(文档)
tdetails =7×3表令牌DocumentNumber类型  ___________________________ ______________ ___________ " “1信”更“1字母”的信息“1字母”,“1标点”看到“1字母" //www.tatmou.com " 1网址”。”1标点符号

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“TopLevelDomains”,(“com”“净”“org”]指定用于web地址检测的顶级域名“com”、“net”和“org”。

用于web地址检测的顶级域名,指定为字符向量、字符串数组或字符向量的单元格数组。

如果没有指定TopLevelDomains,则该函数使用topLevelDomains函数。

例子:[" com”“净”“org”)

数据类型:字符|字符串|细胞

选择放弃先前计算的细节并重新计算它们,指定为真正的

数据类型:逻辑

输出参数

全部折叠

更新的文档,返回为tokenizedDocument数组中。获取令牌的详细信息updatedDocuments,使用tokenDetails

介绍了R2018b