数据分析与人类语言数据

自然语言处理(NLP)是指用于合并的计算技术的大类演讲文本数据与其他类型的工程数据一起,开发智能系统。

原始的人类语言数据可以来自多种来源,包括音频信号、web和社交媒体、包含有价值信息的文档和数据库,如语音命令、主题的公共情绪、操作数据和维护报告。自然语言处理可用于合并和简化这些大型数据源,将它们转换为有意义的见解可视化,主题模型,机器学习分类器。例如,使用MATLAB®你可以在一个音频片段中检测到人类语言的存在,执行语音识别然后对这些资源进行文本挖掘和机器学习。

自然语言处理被用于金融、制造、电子、软件、信息技术和其他行业的应用,例如:

  • 自动分类评论基于情绪,无论是积极的或消极的
  • 统计文档中单词或短语的频率并执行主题建模
  • 开发基于传感器和文本日志数据的预测设备维护计划
  • 语音记录的自动标记和标记

有关使用自然语言处理从语音和文本数据获取理解的更多信息,请参见文本分析工具箱™,音频工具箱™,统计和机器学习工具箱™

参见:数据科学,机器学习,深度学习,情绪分析,文本挖掘,长短时记忆(LSTM)网络