文本分析工具箱™包括来自诸如设备日志,新闻,调查,经营者报告,以及社交媒体处理原始文本的工具。使用这些工具来提取文本从流行的文件格式,预处理原始文本,提取单个词或短语多字(正克),转换成文本数值表示,建立统计模型。有关说明如何上手示例,请参见准备文本数据进行分析。
文本分析工具箱支持英语、日语、德语和韩语。金宝app大多数文本分析工具箱函数可以处理来自其他语言的文本。有关更多信息,请参见语言的注意事项。
这个例子说明了如何从文本,HTML的Microsoft®Word,PDF,CSV和Microsoft Excel档案提取文本数据,并将其导入MATLAB®进行分析。
这个示例展示了如何解析HTML代码并从特定元素中提取文本内容。
发现数据集各种文本分析任务。
这个示例展示了如何创建一个函数来清理和预处理文本数据以便进行分析。
这个例子说明了如何分析包含表情符号,文本数据。
这个例子展示了如何使用Hunspell纠正文档中的拼写错误。
这个例子显示了如何创建一个扩展的hunspell字典拼写校正。
这个示例展示了如何使用编辑距离搜索器和已知单词的词汇表纠正拼写。
使用文本分析工具箱功能的信息用于其他语言。
文本分析工具箱中有关日语支持的信息。金宝app
这个例子说明如何导入,准备和使用主题模型分析日文文本数据。
在文本分析工具箱德国支持的信息。金宝app
这个例子说明如何导入,准备和使用主题模型分析德语文本数据。