Visualize Text Data Using Word Clouds
此示例显示如何使用Word云显示文本数据。
Text Analytics Toolbox扩展了该工具框WordCloud.
(MATLAB)功能。它增加了创建我们金宝app的支持rd clouds directly from string arrays and creating word clouds from bag-of-words models and LDA topics.
加载示例数据。文件factoryreports.csv.
contains factory reports, including a text description and categorical labels for each event.
filename ="factoryReports.csv";tbl = readtable(文件名,'texttype'那'细绳');
Extract the text data from the描述
柱子。
textData = tbl.Description; textData(1:10)
ANS =.10x1字符串“物品偶尔会陷入扫描仪线轴上。”“响亮的嘎嘎声和敲打声来自瓶子活塞。”“在开始植物时,有能力削减到电力。”“汇编器中的油炸电容器。”“搅拌机绊倒了保险丝。”“构造剂中的突发管是喷涂冷却剂。”“融合器吹入混合器中。”“事情继续滚动腰带。”“从传送带的下降物品。”“扫描仪卷轴是拆分的,它很快就开始曲线。”
从报告中创建一个单词云。
图WordCloud(TextData);标题(“工厂报告”的)
将报告中的单词与标签进行比较“泄漏”
and"Mechanical Failure"
。为每个标签创建报告的单词云。为每个单词云指定单词颜色和洋红色。
图标签= tbl.Category;子图(1,2,1)IDX = Labels ==“泄漏”;WordCloud(TextData(IDX),'颜色'那'蓝色的');标题(“泄漏”)子图(1,2,2)idx = labels =="Mechanical Failure";WordCloud(TextData(IDX),'颜色'那'magenta');标题("Mechanical Failure"的)
将报告中的文字与紧急“低”,“中等”和“高”进行比较。
图才usgency = tbl.urgency;子图(1,3,1)IDX = URGENY ==“低的”;WordCloud(TextData(IDX));标题(“紧迫性:低”)子图(1,3,2)idx = urgency =="Medium";WordCloud(TextData(IDX));标题(“紧迫性:中等”)子图(1,3,3)idx = urgency ==“高的”;WordCloud(TextData(IDX));标题("Urgency: High"的)
将报告中的报告中的报告中报告的报告中报告的报告中报告的报告中报告的报告数数千美元报告。为每个数量的报告的单词云分别使用突出显示颜色蓝色和红色。
成本= tbl.cost;IDX =成本> 100;图WordCloud(TextData(IDX),'突出显示彩色'那'蓝色的');标题(“成本> 100美元”的)
IDX =成本> 1000;图WordCloud(TextData(IDX),'突出显示彩色'那'红色的');标题(“费用> 1,000美元”的)
也可以看看
WordCloud.
|tokenizedDocument
|Bagofwords.