此示例显示如何使用Word云显示文本数据。
Text Analytics Toolbox扩展了该功能的功能WordCloud.
(MATLAB)功能。它支持直接从字符金宝app串数组创建Word云,并从单词袋式模型和LDA主题创建单词云。
加载示例数据。文件factoryreports.csv.
包含出厂报告,包括每个事件的文本描述和分类标签。
filename =.“factoryreports.csv”;tbl = readtable(文件名,'texttype'那'细绳');
从中提取文本数据描述
柱子。
textdata = tbl.description;TextData(1:10)
ans =.10x1字符串“物品偶尔会陷入扫描仪线轴上。”“响亮的嘎嘎声和敲打声来自装配者活塞。”“在开始植物时,有能力削减到电力。”“汇编器中的油炸电容器。”“搅拌机绊倒了保险丝。”“构造剂中的突发管是喷涂冷却剂。”“融合在搅拌机中的熔丝。”“事情继续摔倒腰带。”“从传送带的下降物品。”“扫描仪卷轴是拆分的,它很快就开始曲线。”
从报告中创建一个单词云。
图WordCloud(TextData);标题(“工厂报告”)
将报告中的单词与标签进行比较“泄漏”
和“机械故障”
。为每个标签创建报告的单词云。将单词颜色指定为每个单词云的蓝色和洋红色。
图标签= tbl.Category;子图(1,2,1)IDX = Labels ==“泄漏”;WordCloud(TextData(IDX),'颜色'那'蓝色的');标题(“泄漏”)子图(1,2,2)idx = labels ==“机械故障”;WordCloud(TextData(IDX),'颜色'那'品红');标题(“机械故障”)
将报告中的单词与紧急“低”,“中等”和“高”进行比较。
图才能= tbl.urgency;子图(1,3,1)IDX = URGENY ==“低的”;WordCloud(TextData(IDX));标题(“紧迫性:低”)子图(1,3,2)idx = urgency ==“中等的”;WordCloud(TextData(IDX));标题(“紧迫性:中等”)子图(1,3,3)idx = urgency ==“高的”;WordCloud(TextData(IDX));标题(“紧急:高”)
将报告中的报告中的报告中报告的报告中报告的报告中报告的报告中报告的报告数千美元报告。为每个数量的报告的单词云分别使用突出显示颜色蓝色和红色。
成本= tbl.cost;IDX =成本> 100;图WordCloud(TextData(IDX),'explightColor'那'蓝色的');标题(“成本> 100美元”)
IDX =成本> 1000;图WordCloud(TextData(IDX),'explightColor'那'红色的');标题(“成本> 1,000美元”)
Bagofwords.
|令人畏缩的鳕文
|WordCloud.