此示例显示如何使用Word云显示文本数据。
Text Analytics Toolbox扩展了该工具框WordCloud.
(MATLAB)功能。它支持直接从字符金宝app串数组创建词云,并支持从词袋模型和LDA主题创建词云。
加载示例数据。文件factoryreports.csv.
包含工厂报告,包括每个事件的文本描述和分类标签。
filename =“factoryReports.csv”;tbl = readtable(文件名,'texttype'那'细绳');
的文本数据提取描述
柱子。
textData = tbl.Description;textData (1:10)
ANS =.10x1字符串“物品偶尔会陷入扫描仪线轴上。”“响亮的嘎嘎声和敲打声来自瓶子活塞。”“在开始植物时,有能力削减到电力。”“汇编器中的油炸电容器。”“搅拌机绊倒了保险丝。”“构造剂中的突发管是喷涂冷却剂。”“融合器吹入混合器中。”“事情继续滚动腰带。”“从传送带的下降物品。”“扫描仪卷轴是拆分的,它很快就开始曲线。”
从报告中创建一个词云。
图WordCloud(TextData);标题(“工厂报告”的)
将报告中的单词与标签进行比较“泄露”
和“机械故障”
。为每个标签创建报告的单词云。为每个单词云指定单词颜色和洋红色。
图标签= tbl.Category;子图(1,2,1)IDX = Labels ==“泄露”;WordCloud(TextData(IDX),'颜色'那'蓝色');标题(“泄露”)子图(1,2,2)idx = labels ==“机械故障”;WordCloud(TextData(IDX),'颜色'那“红色”);标题(“机械故障”的)
将报告中的文字与紧急“低”,“中等”和“高”进行比较。
图才usgency = tbl.urgency;子图(1,3,1)IDX = URGENY ==“低的”;WordCloud(TextData(IDX));标题(“紧迫性:低”)子图(1,3,2)idx = urgency ==“媒介”;WordCloud(TextData(IDX));标题(“紧迫性:中等”)子图(1,3,3)idx = urgency ==“高的”;WordCloud(TextData(IDX));标题(“紧迫性:高”的)
将报告中的报告中的报告中报告的报告中报告的报告中报告的报告中报告的报告数数千美元报告。为每个数量的报告的单词云分别使用突出显示颜色蓝色和红色。
成本= tbl.cost;IDX =成本> 100;图WordCloud(TextData(IDX),'突出显示彩色'那'蓝色');标题(“成本> 100美元”的)
IDX =成本> 1000;图WordCloud(TextData(IDX),'突出显示彩色'那'红色的');标题(“费用> 1,000美元”的)
WordCloud.
|tokenizedDocument
|Bagofwords.