文档帮助中心文档
向文档中添加令牌类型详细信息
updatedDocuments=addTypeDetails(文档)
updatedDocuments=addTypeDetails(文档、名称、值)
实例
更新的文档=addTypeDetails(文件)检测中的令牌类型文件并更新令牌详细信息。此函数仅向未知类型的令牌添加类型详细信息。若要从更新的文档,使用令牌详细信息.
更新的文档=addTypeDetails(文件)
更新的文档
文件
令牌详细信息
更新的文档=addTypeDetails(文件,名称、值)使用一个或多个名称-值对指定其他选项。
更新的文档=addTypeDetails(文件,名称、值)
名称、值
提示
使用addTypeDetails在使用降低,上面的,删除标点符号函数作为addTypeDetails使用这些函数删除的信息。
addTypeDetails
降低
上面的
删除标点符号
全部崩溃
将手动标记的文本转换为tokenizedDocument对象,设置“标记化方法”选项“没有”.
tokenizedDocument
“标记化方法”
“没有”
str=[“对”“更多”“信息”","“见”"//www.tatmou.com""."];文档=标记化文档(str,“标记化方法”,“没有”)
documents=tokenizedDocument:7标记:有关更多信息,请参阅//www.tatmou.com .
使用令牌详细信息作用
t详细信息=令牌详细信息(文档)
tdetails =7×2表令牌文档编号\uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu//www.tatmou.com" 1 "." 1
如果你设置“标记化方法”到“没有”在呼叫tokenizedDocument函数,则它不会检测令牌的类型。要添加令牌类型详细信息,请使用addTypeDetails作用
= addTypeDetails文件(文档);
查看更新的令牌详细信息。
tdetails =7×3表“1个字母”更多“1个字母”信息“1个字母”,“1个标点符号”请参见“1个字母”//www.tatmou.com“1个网址”“1个标点符号”
输入文档,指定为tokenizedDocument大堆
指定可选的逗号分隔的字符对名称、值论据。名称是参数名和价值为对应值。名称必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:Name1, Value1,…,的家.
名称
价值
Name1, Value1,…,的家
“TopLevelDomains”,[“com”“net”“org”]
TopLevelDomains
用于web地址检测的顶级域,指定为字符向量、字符串数组或字符向量的单元格数组。
如果您没有指定TopLevelDomains,则该函数使用顶级域作用
顶级域
例子:[“com”“net”“org”]
[“com”“net”“org”]
数据类型:烧焦|一串|单间牢房
烧焦
一串
单间牢房
放弃知识价值
错误的
真正的
放弃以前计算的详细信息并重新计算它们的选项,指定为真正的或错误的.
数据类型:必然的
必然的
已更新的文档,作为tokenizedDocument大堆要从中获取令牌详细信息,请执行以下操作:更新的文档,使用令牌详细信息.
tokenizedDocument|令牌详细信息|附加语句详细信息|addPartOfSpeechDetails|分句|缩写|顶级域|corpusLanguage|addLanguageDetails|Addlemmadetals|附加细节
附加语句详细信息
addPartOfSpeechDetails
分句
缩写
corpusLanguage
addLanguageDetails
Addlemmadetals
附加细节
您有此示例的修改版本。是否要用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站以获取翻译后的内容(如果可用),并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。
联系当地办事处