文档帮助中心文档
单词的正确拼写
updatedDocuments=拼写正确(文档)
用语updatedWords =(单词)
用语updatedWords =(话说,“语言”,语言)
[___,未知词]=正确拼写(___)
___=拼写正确(___,名称,值)
使用拼写正确纠正字符串数组或文档中单词的拼写。
拼写正确
该函数支持英语、德语和韩语金宝app文本。
实例
更新的文档=拼写正确(文档)纠正单词的拼写tokenizedDocument大堆文档.
更新的文档=拼写正确(文档)
更新的文档
文档
tokenizedDocument
updatedWords=拼写正确(话)纠正单词的拼写字符串向量话.
updatedWords=拼写正确(话)
updatedWords
话
字符串
updatedWords=拼写正确(话","语言",,语言)还指定中单词的语言字符串向量话.
updatedWords=拼写正确(话","语言",,语言)
语言
[___,未知词用语]= (___)还返回输入中未在字典中找到且未找到建议的单词向量。
[___,未知词用语]= (___)
未知词
___=拼写正确(___,名称、值)使用一个或多个名称-值对参数指定其他选项。
___=拼写正确(___,名称、值)
名称、值
全部崩溃
创建标记化的文档数组。
str = [“包含一些拼写错误的单词的文档。”“又是一个文档输入错误。”];文档=标记化文档(str);
使用以下命令更正文档中单词的拼写:拼写正确作用
updatedDocuments = 2x1 tokenizedDocument: 7 tokens:包含一些拼写错误单词的文档。5记号:另一份包含打字错误的文件。
创建一个字串数组。
单词=[“A”“strng”“数组”“包含”“拼写错误”“worrds”“。”];
使用拼写正确作用
updatedWords =1x7字符串第1列到第6列“A”“字符串”“数组”“包含”“拼写错误”“单词”“第7列”。
str = [“使用MATLAB分析文本数据。”“又是一个文档输入错误。”];文档=标记化文档(str);
updatedDocuments = 2x1 tokenizedDocument: 7 token:使用MAT LAB分析文本数据。5记号:另一份包含打字错误的文件。
请注意,“MATLAB”一词被分成两个词“MAT”和“LAB”。
修改文档的拼写,并指定“MATLAB”为已知单词“KnownWords”选项
“KnownWords”
更新文档=拼写正确(文档,“KnownWords”,“MATLAB”)
updatedDocuments=2x1 tokenizedDocument:6个标记:使用MATLAB分析文本数据。5个标记:另一个包含打字错误的文档。
输入文档,指定为tokenizedDocument大堆
输入字,指定为字符串向量、字符向量或字符向量的单元格数组。如果您指定话作为字符向量,函数将参数视为单个单词。
数据类型:字符串|烧焦|单间牢房
烧焦
单间牢房
“嗯”
“德”
“柯”
文字语言,指定为下列语言之一:
“嗯”- - - - - -英语
“德”-德语
“柯”–韩语
如果您没有指定语言,软件会自动检测语言。
数据类型:烧焦|字符串
指定可选的逗号分隔的字符对名称、值论据。的名字是参数名和价值为对应值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:名称1,值1,…,名称,值.
的名字
价值
名称1,值1,…,名称,值
拼写正确(文档,'knowwords',[“MathWorks”“MATLAB”])
知识
[]
要被视为正确的单词,指定为逗号分隔对,由“KnownWords”以及字符向量的字符串数组或单元格数组。
如果指定了一个已知单词的列表,那么当函数纠正拼写时,这些单词将保持不变。该软件还可以用已知单词列表中的单词替换拼写错误的单词。
例子:[" MathWorks”“MATLAB”)
[" MathWorks”“MATLAB”)
数据类型:烧焦|字符串|单间牢房
外延描写
''
Hunspell扩展字典文件(也称为个人字典文件),指定为逗号分隔对组成“ExtensionDictionary”以及拼写扩展字典文件的文件路径。
“ExtensionDictionary”
拼写扩展字典文件是.dic包含字典中单词数量的文件,后跟以下格式的单词列表:
.dic
/ affixWord1 word1 word2 / affixWord2……wordN/affixWordN *forbiddenWord1 *forbiddenWord2…* forbiddenWordM
字1,字2, …,沃顿是扩展Hunspell词典的单词列表。
字1
字2
沃顿
affixWord1,affixWord2, …,affixWordN(可选)指出拼写词典中共享词缀的单词。通过用正斜杠将词缀连接到相应的单词来表示词缀(/)。例如极端/极端表示应用于单词的词缀“极端”也适用于自定义词“exxxtreme”.
affixWord1
affixWord2
affixWordN
/
极端/极端
“极端”
“exxxtreme”
禁忌词,禁忌词, …,禁忌词是用于拼写更正的禁用词列表。请使用星号指示禁用词(*).
禁忌词
*
拼写扩展词典文件中的条目可以以任何顺序出现。在拼写词典文件中指定单词时,必须以基本形式指定单词。例如,确保拼写正确函数不转换字符串“法令”来“法规”使用扩展字典,指定基本单词“法令”作为一个禁忌词。
“法令”
“法规”
例如,要创建拼写扩展词典文件,请指定:
文字“数学作品”,“MATLAB”,“exxxtreme”.
“数学作品”
“MATLAB”
适用于这个词的词缀“极端”也适用于这个词“exxxtreme”.
字眼“南”这是一个禁忌词。
“南”
使用:
MathWorks MATLAB exxxtreme/extreme*NaN
有关如何创建拼写扩展词典文件的示例,请参见创建用于拼写更正的扩展词典。有关拼写词典文件选项的详细信息,请参阅https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.
字典
拼写词典文件,指定为逗号分隔对,由“字典”以及拼写词典文件的文件路径。
“字典”
拼写词典文件是.dic包含字典中单词数量的文件,后跟以下格式的单词列表:
N单词1/flags1单词2/flags2…单词N/flagsN
在哪里N是字典文件中的字数,字1,字2, …,沃顿是吗N词典中的单词,以及flags1, …,flagsN指定与单词对应的可选标志字1,字2, …,沃顿使用标志指定单词属性,例如词缀。要指定拼写词缀文件,请使用“词缀”选项
N
flags1
flagsN
“词缀”
例如,a可以创建包含4个单词的拼写词典文件“数学作品”,“MATLAB”,“更正拼写”,“标记化文档”使用:
“更正拼写”
“标记化文档”
4 MathWorks MATLAB更正拼写标记化文档
有关拼写词典文件选项的详细信息,请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.
词缀
拼写粘贴文件,指定为逗号分隔对,由“词缀”Hunspell后缀文件的文件路径。
一个Hunspell后缀文件是一个.aff包含字典中单词数量的文件,后跟以下格式的单词列表:
.aff
选项1值1选项2值2…选项M值M
在哪里M是粘贴文件中的选项数,选择1,选择2, …,选项是吗M选项,以及values1, …,valuesN指定与选项对应的值选择1,选择2, …,选项,分别。使用这些选项来指定词缀。
M
选择1
选择2
选项
values1
valuesN
要定义前缀规则,请使用PFX具有以下格式的选项:
PFX
PFX flag stripping1 prefix1 condition1…PFX flag strippingK prefixK conditionK
旗帜对应于拼写词典文件中使用的标志。
旗帜
crossProduct指示前缀和后缀是否可以混合,指定为Y或N.
crossProduct
Y
K为指定标志定义的前缀数。
K
stripping1,stripping2, …,脱衣舞当应用前缀时,指示要从单词中删除的字符。若剥离值为0,则不剥离。
stripping1
stripping2
脱衣舞
0
prefix1,prefix2, …,前缀k指定要使用的前缀。
prefix1
prefix2
前缀k
condition1,condition2, …,conditionK指定应用前缀的可选条件prefix1,prefix2, …,前缀k对于普通条件,指定“。”.
condition1
condition2
conditionK
“。”
要定义后缀规则,请使用SFX具有以下格式的选项:
SFX
SFX标志交叉积K SFX标志剥离1后缀条件1…SFX标志剥离K后缀条件K
后缀1
足够的
后缀
创建一个Hunspell词缀文件,定义以下词缀规则:
国旗:
带前缀的单词“re”
“re”
国旗B:
后缀不是以。结尾的单词“y”具有“ed”.
“y”
“ed”
以结尾的后缀词“y”具有“简易爆炸装置”,删除“y”.
“简易爆炸装置”
使用Hunspell后缀文件:
PFX A Y 1 PFX A 0 re。SFX B Y 1 SFX B 0 ed[^Y]SFX B Y ied Y
要在拼写词典文件中使用这些标志,请使用“/”.对于每个单词,您可以指定多个标志。例如,要指定包含以下内容的字典文件:
“/”
文字“pt”和“私人”.
“pt”
“私人”
对这个词“pt”只有,也包括前缀“re”使用国旗A..
A.
对于这两个单词,还包括后缀“ed”或“简易爆炸装置”在适当的地方使用标志B
B
有关Hunspell后缀文件选项的详细信息,请参见https://manpages.ubuntu.com/manpages/trusty/en/man4/hunspell.4.html.
复述法
“分裂”
“没有”
方法重新排序文档,指定为逗号分隔对,由“RetokenizeMethod”以及下列其中一项:
“RetokenizeMethod”
“分裂”–通过拆分标记纠正拼写。例如,拆分拼写错误的标记“twowords”输入拼写正确的标记“两个”和“单词”.
“twowords”
“两个”
“单词”
“没有”–不要为了拼写更正而拆分标记。
更正的文件,作为一个tokenizedDocument数组。如果“RetokenizeMethod”选择是“分裂”,则每个更新文档中的字数可能与相应的输入文档不同。
如果有多个候选修正词,那么该功能会自动选择一个单词进行修正。
已更正的单词,作为字符串向量返回。如果“RetokenizeMethod”选择是“分裂”,则更新的字数可能与输入的字数不同。
未知单词,作为字符串向量返回。字符串向量未知词包含不在拼写纠正字典中且没有找到建议的输入单词。
编辑距离搜索器|编辑距离|tokenizedDocument
编辑距离搜索器
编辑距离
您拥有此示例的修改版本。是否要用编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区站点不适合您所在位置的访问。
联系当地办事处