主要内容

添加剂尾尾

将实体标签添加到文档

描述

利用添加剂尾尾将实体标签添加到文档中。

利用添加剂尾尾检测文本中的人的名称,位置,组织和其他命名实体。这个过程称为命名实体识别

该功能支持英语,日语,德语金宝app和韩语文本。

例子

更新Documents= AddentityDetails(文件检测到指定的实体文件。该函数仅具有缺失实体详细信息的令牌添加详细信息。从中获取实体详细信息更新Documents, 利用tokendetails

更新Documents= AddentityDetails(文件,,,,名称,价值还使用一个或多个名称值对指定其他选项。

小费

利用添加剂尾尾使用之前降低,,,,,,,,归一化词,,,,删除字, 和删除词功能为添加剂尾尾使用这些功能删除的信息。

例子

全部收缩

创建一个令牌化的文档数组。

str = [“玛丽搬到了马萨诸塞州的纳蒂克。”“约翰在Mathworks使用Matlab。”];文档= tokenizedDocument(str);

使用该实体详细信息将实体详细信息添加到文档中添加剂尾尾功能。此功能检测文本中的命名实体,并将详细信息添加到由tokendetails功能。查看前几个令牌的更新令牌详细信息。

documents = AddentityDetails(文档);tdetails = tokendetails(文档)
tdetails =13×8桌Token DocumentNumber SentenceNumber LineNumber Type Language PartOfSpeech Entity _______________ ______________ ______________ __________ ___________ ________ ____________ ____________ "Mary" 1 1 1 letters en proper-noun person "moved" 1 1 1 letters en verb non-entity "to" 1 1 1 letters en adposition non- 实体“ natick” 1 1 1个字母en porpor-noun位置”,“ 1 1 1标点符号en标点符号非实体“马萨诸塞州” 1 1 1 1个字母en poper-noun位置”。1 1 1标点符标点符号非实体“约翰” 2 1 1个字母en porpor-noun Person“使用” 2 1 1 letters en en dever en en demity en demity“ matlab” 2 1 1 1 letters en porter-noun e porter-noun e porter-noun at ot at'2 11个字母递送非实体“数学” 2 1 1个字母en porpor-noun组织“”。2 1 1标点符号非实体

查看用实体标记的单词“人”,,,,“地点”,,,,“组织”, 或者“其他”。这些单词是没有标记的单词“非实体”

idx = tdetails.entity〜 =“非实体”;tdetails.token(IDX)
ans =6x1字符串“玛丽”“纳蒂克”“马萨诸塞州”“ John”“ Matlab”“ Mathworks”

使用的日语文字使用象征性文档

str = [“マリーさんからニューヨーク引っ越しまし。”“駅でさん迎えにます。”“东京はよりです?”“”东京た,新宿渋谷など所をましまし。。];文档= tokenizedDocument(str);

对于日语文本,该软件会自动添加名为实体标签,因此您无需使用添加剂尾尾功能。该软件可检测人员的名称,位置,组织和其他命名实体。要查看实体详细信息,请使用tokendetails功能。

tdetails = tokendetails(文档);头(tdetails)
ans =8×8桌Token DocumentNumber LineNumber Type Language PartOfSpeech Lemma Entity ____________ ______________ __________ _______ ________ ____________ ____________ __________ "マリー" 1 1 letters ja proper-noun "マリー" person "さん" 1 1 letters ja noun "さん" person "は" 1 1 letters ja adposition“は”非实体“ボストン” 1 1个字母ja porpor-noun“ location” location“ location” location'から“ 1 1个字母ja adposition” non-endity“ n​​on-endity”ニューヨーク“ 1 1个字母ja porth ja porter-noun“ location” location'“ 1 1个字母Ja adposition”に“非实体”引っ越し” 1 1个字母JA动词“引っ越す”非实体

查看用实体标记的单词“人”,,,,“地点”,,,,“组织”, 或者“其他”。这些单词是未标记的单词“非实体”

idx = tdetails.entity〜 =“非实体”;tdetails(idx,:)。令牌
ans =11x1字符串“マリー”“さん”“ボストン”“ニューヨーク”“铃木”“”“さん”“东京”“大阪”“”“东京”“新宿”“渋谷”。

使用德语文字象征性文档

str = [“恩斯特·佐格·冯·法兰克福·纳赫·柏林。”“ Besuchen Sie Volkswagen在沃尔夫斯堡。”];文档= tokenizedDocument(str);

要将实体标签添加到德语文本中,请使用添加剂尾尾功能。此功能检测人的名称,位置,组织和其他命名实体。

documents = AddentityDetails(文档);

要查看实体详细信息,请使用tokendetails功能。

tdetails = tokendetails(文档);头(tdetails)
ans =8×8桌Token DocumentNumber SentenceNumber LineNumber Type Language PartOfSpeech Entity ___________ ______________ ______________ __________ ___________ ________ ____________ __________ "Ernst" 1 1 1 letters de proper-noun person "zog" 1 1 1 letters de verb non-entity "von" 1 1 1 letters de adposition non- 实体“法兰克福” 1 1 1个字母de porpor-noun位置“ nach” 1 1 1个字母de pet ples de position de deposity de deposity'柏林“ 1 1 1 1 letters de porpor-noun的位置”。1 1 1标点符标点非实体“ besuchen” 2 1 1个字母de动词非实体

查看用实体标记的单词“人”,,,,“地点”,,,,“组织”, 或者“其他”。这些单词是没有标记的单词“非实体”

idx = tdetails.entity〜 =“非实体”;tdetails(idx,:)
ans =5×8桌Token DocumentNumber SentenceNumber LineNumber Type Language PartOfSpeech Entity ____________ ______________ ______________ __________ _______ ________ ____________ ____________ "Ernst" 1 1 1 letters de proper-noun person "Frankfurt" 1 1 1 letters de proper-noun location "Berlin" 1 1 1 letters de proper-名词位置“大众” 2 1 1个字母de名词组织“沃尔夫斯堡” 2 1 1个字母de porpor-noun位置

输入参数

全部收缩

输入文档,指定为象征性文档大批。

名称值参数

将可选的参数对name1 = value1,...,namen = valuen, 在哪里姓名是参数名称和价值是相应的值。名称值参数必须在其他参数之后出现,但是对的顺序并不重要。

在R2021a之前,请使用逗号分隔每个名称和值,并附上姓名用引号。

例子:“丢弃知名度”,真实指定先前计算的详细信息并重新计算它们。

重述文档的方法,指定为以下一项:

  • '实体'- 转换命名实体识别的令牌。该函数将来自同一实体的令牌合并为单个令牌。

  • '没有任何'- 不要重述文件。

选项丢弃先前计算的详细信息并重新计算它们,指定为真的或者错误的

数据类型:逻辑

输出参数

全部收缩

更新的文档,返回为象征性文档大批。从中获取令牌细节更新Documents, 利用tokendetails

算法

全部收缩

语言细节

象征性文档对象包含有关令牌的详细信息,包括语言详细信息。输入文档的语言详细信息确定添加剂尾尾。这象征性文档默认情况下,函数会自动检测输入文本的语言。要手动指定语言详细信息,请使用'语'名称值对参数象征性文档。要查看令牌详细信息,请使用tokendetails功能。

版本历史记录

在R2019a中引入