自然语言处理

使用人类语言数据进行数据分析

自然语言处理(NLP)是一类广泛的计算技术演讲文本数据,以及其他类型的工程数据,用于智能系统的开发。

原始人类语言数据可以来自多种来源,包括音频信号、网络和社交媒体、包含有价值信息的文档和数据库,如语音命令、主题公众情绪、操作数据和维护报告。自然语言处理可用于组合和简化这些大型数据源,将它们转换为有意义的洞察力可视化,主题模型,及机器学习分类器. 例如,使用MATLAB®您可以检测音频段中是否存在人类语音,执行以下操作:从语音到文本转录,然后对这些源执行文本挖掘和机器学习。

自然语言处理应用于金融、制造、电子、软件、信息技术和其他行业,例如:

  • 根据积极或消极的情绪自动对评论进行分类
  • 计算文档中单词或短语的频率并执行主题建模
  • 基于传感器和文本日志数据制定预测性设备维护计划
  • 自动标记和标注语音记录

要了解有关使用自然语言处理从语音和文本数据中获取理解的更多信息,请参阅文本分析工具箱™,音频工具箱™,及统计和机器学习工具箱™.

另见:数据科学,机器学习,深度学习,情绪分析,文本挖掘,长短时记忆(LSTM)网络,N克