主要内容

正确的拼写在文档中

这个例子展示了如何使用Hunspell正确拼写文档。

加载文本数据

创建一个数组的标记化的文档。

str = [“使用MATLAB的正确拼写单词。”“正确拼写worrds是重要的词元化”。“文本分析工具箱providesfunctions拼写校正”。];文件= tokenizedDocument (str)
令牌文件= 3 x1 tokenizedDocument: 8:使用MATLAB的正确拼写单词。8令牌:拼写正确worrds是重要的词元化。8令牌:文本分析工具箱providesfunctions拼写校正。

正确的拼写

正确的拼写使用的文档用语函数。

updatedDocuments =用语(文档)
updatedDocuments = 3 x1 tokenizedDocument: 9令牌:用垫实验室正确拼写单词。8令牌:拼写正确的单词对举行仪式很重要。9令牌:文本分析工具箱提供了拼写校正功能。

注意:

  • 输入单词“MATLAB”分为两个字“垫”和“实验室”。

  • 输入单词“worrds”改为“单词”。

  • 输入“词元化”已改为“举行仪式”。

  • 输入单词“分析”改为“分析”。

  • 输入单词“providesfunctions”分为两个字“提供”和“功能”。

指定自定义词

防止软件更新特定的词,您可以提供一个使用已知的词汇列表“KnownWords”选择的用语函数。

正确的拼写,指定单词的文档“MATLAB”,“分析”,“词元化”作为已知的单词。

updatedDocuments =用语(文档,“KnownWords”,(“MATLAB”“分析”“词元化”])
updatedDocuments = 3 x1 tokenizedDocument: 8令牌:使用MATLAB的正确拼写单词。8令牌:正确地拼写单词是重要的词元化。9令牌:文本分析工具箱提供了拼写校正功能。

注意这里“MATLAB”、“分析”,“词元化”保持不变。

另请参阅

|

相关的话题