这个例子展示了如何使用Hunspell正确拼写文档。
创建一个数组的标记化的文档。
str = [“使用MATLAB的正确拼写单词。”“正确拼写worrds是重要的词元化”。“文本分析工具箱providesfunctions拼写校正”。];文件= tokenizedDocument (str)
令牌文件= 3 x1 tokenizedDocument: 8:使用MATLAB的正确拼写单词。8令牌:拼写正确worrds是重要的词元化。8令牌:文本分析工具箱providesfunctions拼写校正。
正确的拼写使用的文档用语
函数。
updatedDocuments =用语(文档)
updatedDocuments = 3 x1 tokenizedDocument: 9令牌:用垫实验室正确拼写单词。8令牌:拼写正确的单词对举行仪式很重要。9令牌:文本分析工具箱提供了拼写校正功能。
注意:
输入单词“MATLAB”分为两个字“垫”和“实验室”。
输入单词“worrds”改为“单词”。
输入“词元化”已改为“举行仪式”。
输入单词“分析”改为“分析”。
输入单词“providesfunctions”分为两个字“提供”和“功能”。
防止软件更新特定的词,您可以提供一个使用已知的词汇列表“KnownWords”
选择的用语
函数。
正确的拼写,指定单词的文档“MATLAB”,“分析”,“词元化”作为已知的单词。
updatedDocuments =用语(文档,“KnownWords”,(“MATLAB”“分析”“词元化”])
updatedDocuments = 3 x1 tokenizedDocument: 8令牌:使用MATLAB的正确拼写单词。8令牌:正确地拼写单词是重要的词元化。9令牌:文本分析工具箱提供了拼写校正功能。
注意这里“MATLAB”、“分析”,“词元化”保持不变。