Text Analytics Toolbox™包括用于处理来自设备日志,新闻提要,调查,操作员报告和社交媒体等原始文本的工具。使用这些工具从流行的文件格式,预处理原始文本,提取单个单词或多字短语(n-gram),将文本转换为数值表示并构建统计模型。有关显示如何入门的示例,请参阅准备文本数据进行分析。
文本分析工具箱支持英语,日语,德语和韩文语言。金宝app大多数文本分析工具箱函数与其他语言的文本一起使用。有关更多信息,请参阅语言注意事项。
此示例显示了如何从文本,HTML,Microsoft®Word,PDF,CSV和MicrosoftExcel®文件中提取文本数据,并将其导入MATLAB®进行分析。
此示例显示了如何解析HTML代码并从特定元素中提取文本内容。
发现各种文本分析任务的数据集。
此示例显示了如何创建一个清洁和预处理文本数据以进行分析的函数。
此示例显示了如何分析包含表情符号的文本数据。
此示例显示了如何使用Hunspell在文档中纠正拼写。
此示例显示了如何创建用于拼写校正的悬缝扩展字典。
此示例显示了如何使用编辑距离搜索器和已知单词的词汇来纠正拼写。