从文本数据中获得洞察力

文本挖掘是指使用数据分析技术在文本数据中搜索模式,包括导入、探索、可视化,并将统计和机器学习算法应用于文本数据。

人工阅读和整理大量文本对人类来说是无法克服的;MATLAB®可以有效和高效地自动化流程,使您能够与数据交互并可视化数据,以识别其他方式无法找到的模式、趋势和复杂关系。

文本挖掘用于派生定量统计对大型非结构化文本集,在文档中使用主题主题建模,定性推论情绪分析,以及其他有价值的信息。文本挖掘应用于金融、制造业、信息技术和许多其他行业。应用程序包括:

  • 统计文档中单词或短语的使用频率并执行数据分析
  • 自动分类评论基于情绪,无论是积极的或消极的
  • 根据传感器和文本日志数据制定预测性设备维护计划

要了解更多关于使用文本挖掘从文本数据获得洞察力的信息,请参见文本分析工具箱™统计和机器学习工具箱™

参见:数据科学,机器学习,统计和机器学习工具箱,自然语言处理,情绪分析,长-短期记忆(LSTM)网络,语法