Text Analytics Toolbox™提供用于预处理,分析和建模文本数据的算法和可视化。使用工具箱创建的模型可用于语言分析,预测性维护和主题建模等应用程序。
Text Analytics工具箱包括从设备日志,新闻源,调查,运营商报告和社交媒体等源处理原始文本的工具。您可以从流行文件格式提取文本,预处理原始文本,提取单个单词,将文本转换为数字表示,并构建统计模型。
使用机器学习技术,如LSA,LDA和Word Embeddings,您可以找到来自高维文本数据集的群集并创建功能。使用Text Analytics Toolbox创建的功能可以与其他数据源的功能组合,以构建机器学习模型,以利用文本,数字和其他类型的数据。
此示例显示如何使用文本分析来使用10行的MATLAB®代码对文本数据进行分类。
从不同来源导入文本数据。
此示例显示如何创建清除和预处理文本数据进行分析的函数。
此示例显示如何将主题模型拟合到文本数据并可视化主题。
此示例显示如何使用Word云显示文本数据。
文本分析词汇表。