文本分析工具箱™ 提供用于预处理、分析和建模文本数据的算法和可视化。使用工具箱创建的模型可用于情绪分析、预测性维护和主题建模等应用程序。
文本分析工具箱包括用于处理来自设备日志、新闻提要、调查、操作员报告和社交媒体等源的原始文本的工具。您可以从常用文件格式中提取文本,预处理原始文本,提取单个单词,将文本转换为数字表示,以及构建统计模型。
使用机器学习技术(如LSA、LDA和单词嵌入),您可以从高维文本数据集中查找群集并创建功能。使用文本分析工具箱创建的功能可以与其他数据源的功能组合,以构建利用文本、数字和其他类型数据的机器学习模型。
此示例演示如何使用文本分析仅使用10行MATLAB®代码对文本数据进行分类。
从不同来源导入文本数据。
此示例演示如何创建一个函数,用于清理和预处理文本数据以进行分析。
此示例演示如何将主题模型与文本数据相匹配,并使主题可视化。
此示例演示如何使用word clouds可视化文本数据。
文本分析术语表。