主要内容

在文件中正确拼写

此示例显示如何使用HUNSPELL纠正文档中的拼写。

加载文本数据

创建一系列令牌文档。

str = [“使用matlab纠正拼写单词。”“正确拼写的令人担忧对lemmatization很重要。”“文本分析工具箱提供拼写校正的功能。”];文档= tokenizeddocument(str)
文档= 3x1 tokenizeddocument:8令牌:使用matlab纠正单词的拼写。8令牌:正确拼写的令人担忧对lemmatization很重要。8令牌:文本分析工具箱为拼写校正提供功能。

正确拼写

使用使用的校正文件的拼写矫正力功能。

updateddocuments =纠正率(文件)
UpdatedDocuments = 3x1令叫授予Document:9令牌:使用MAT实验室纠正单词的拼写。8令牌:正确拼写的单词对于纪念来说很重要。9令牌:文本分析工具箱提供拼写校正的功能。

请注意:

  • 输入字“Matlab”已被分成两个单词“垫”和“实验室”。

  • 输入字“担心”已更改为“单词”。

  • 输入字“lemmatization”已被改为“持续”。

  • 输入字“Analytics”已更改为“分析”。

  • 输入字“提供功能”已分成两个单词“提供”和“功能”。

指定自定义单词

要防止软件更新特定单词,您可以使用使用的已知单词列表'众所周知'选项矫正力功能。

再次纠正文档的拼写,并指定“matlab”,“分析”和“lemmatization”的单词,如已知单词。

updateddocuments =纠正率(文件,'众所周知',[“matlab”“分析”“lemmatization”])
updateddocuments = 3x1嘟enizeddocument:8令牌:使用matlab纠正单词的拼写。8令牌:正确拼写的单词对于lemmatization很重要。9令牌:Text Analytics Toolbox提供拼写校正功能。

请注意,“matlab”,“分析”和“lemmatization”单词保持不变。

也可以看看

|

相关话题