文件帮助中心文件
将句号添加到文件中
UpdatedDocuments = AddSentEnCentails(文档)
UpdatedDocuments = AddSentEnCentails(文档,名称,值)
用AddsentEnCentails.将句子信息添加到文档中。
AddsentEnCentails.
该功能支持英语,日语,德语金宝app和韩文文本。
例子
更新录容= AddsentEnCentails(文件的)检测句子边界文件并更新令牌详细信息。从...获得句子细节更新录容, 用令敬当。
更新录容= AddsentEnCentails(文件的)
更新录容
文件
令敬当
更新录容= AddsentEnCentails(文件那名称,价值的)使用一个或多个名称值对参数指定其他选项。
更新录容= AddsentEnCentails(文件那名称,价值的)
名称,价值
提示
用AddsentEnCentails.在使用之前降低那上那侵蚀那正常化字那删除, 和Removestopwords.用作AddsentEnCentails.使用这些功能删除的信息。
降低
上
侵蚀
正常化字
删除
Removestopwords.
全部收缩
创建一个令牌化文档阵列。
str = [......“这是一个例子文件。它有两个句子。”“这份文件有一句话。”“这是另一个示例文档。它还有两个句子。”];文档=令授权鳕(str);
使用以下文件添加句子详细信息AddsentEnCentails.。此功能将句号添加到返回的表令敬当。查看最初几个令牌的更新令牌详细信息。
Documents = AddsentEnCentails(文件);Tdetails =令象牙(文件);头(Tdetails)
ANS =.8×6表令牌DocumentNumber sendenceNumber LineNumber类型语言__________ __________________________________________________________________字母en“是”1 1 1字母EN“示例”1 1 1 1 1字母EN“文档”1 1 1 1字母en“。”1 1 1标点符号en“它”1 2 1字母EN“有”1 2 1字母EN
查看第三个文档的第二句话的令牌详细信息。
idx = tdetails.documentnumber == 3&......tdetails.sentencenumber == 2;Tdetails(IDX,:)
ANS =.6×6表令牌documentnumber sentencenumber linenumber型语言___________ ____________________________________________________________________________________________________字母en“。”3 2 1标点符号en
令人生畏的鳕文
输入文档,指定为a令人生畏的鳕文大批。
指定可选的逗号分离对名称,价值论点。姓名是参数名称和价值是相应的价值。姓名必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen。
姓名
价值
name1,value1,...,namen,valuen
'缩写',[“cm”“mm”“in”]
缩写
缩写列表,指定为字符串阵列,字符向量,字符向量的单元格数组或表格。
如果缩写是字符串数组,字符向量或字符矢量的单元格数组,然后该函数将它们视为常规缩写。如果下一个单词是一个大写句子启动器,那么函数会在尾随时间内打破。该函数忽略了缩写的字母案例中的任何差异。使用使用的句子启动器初学者名称值对。
初学者
在缩写缩写时拆分句子时指定不同的行为,请指定缩写作为桌子。表必须具有名为的变量缩写和用法, 在哪里缩写包含缩写,和用法包含每个缩写的类型。下表描述了可能的值用法以及当通过这些类型的缩写时函数的行为。
用法
常规的
“预订一家议会。我们会见面。”
“预订一个appt。”
“我们会见面。”
“预订一本。今天。”
内
“史密斯博士。”
参考
“见图3.”
“尝试一个图。他们很好。”
“尝试图。”
“他们很好。”
单元
“高度为30英寸。宽度为10英寸”
“高度为30英寸”
“宽度为10英寸”
“该项目是10英寸宽。”
“进来。坐下。”
“进来吧。”
“坐下。”
默认值是输出缩写功能。对于日语和韩文文本,缩写通常不会影响句子检测。
默认情况下,该函数将单个字母缩写,例如“V”或具有混合单个字母和周期的令牌,例如“U.S.A.”。作为常规缩写。您不需要包含这些缩写缩写。
例子:[“cm”“mm”“在”中]
[“cm”“mm”“在”中]
数据类型:char|细绳|桌子|细胞
char
细绳
桌子
细胞
启动句子的单词,指定为字符串阵列,字符向量或字符向量的小区数组。如果句子起动器在常规缩写后大写,则该函数在尾随时段检测句子边界。该函数忽略了句子启动器的字母案例中的任何差异。
默认值是输出秒表功能。
秒表
数据类型:char|细绳|细胞
DiscardKnownValues.
错误的
真的
丢弃先前计算的详细信息并重新计算,指定为真的或者错误的。
数据类型:逻辑
逻辑
更新的文件,返回A.令人生畏的鳕文大批。从...获得令牌细节更新录容, 用令敬当。
这AddsentEnCentails.函数根据标点符号字符和行号信息检测句子边界。对于英语和德语文本,该函数还使用传递给函数的缩写列表。
对于其他语言,您可能需要指定您自己的句子检测缩写列表。为此,使用'缩写'选择AddsentEnCentails.。
'缩写'
如果在终止标点符号之后出现表情符号或表情符号字符,则该函数在表情符号和表情符号之后拆分句子。
令敬当|addpartofspeechdetails.|分裂|缩写|令人生畏的鳕文|addlangugseTails.|addtypedetails.|addlemmadetails.|添加性etails.
addpartofspeechdetails.
分裂
addlangugseTails.
addtypedetails.
addlemmadetails.
添加性etails.
您拥有此示例的修改版本。您是否希望使用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,以便在可用的地方进行翻译内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获得最佳网站性能。其他MathWorks国家网站未优化您所在地的访问。
联系您当地的办公室