可视化LDA的话题用单词云

打开生活的脚本

这个例子展示了如何在潜在狄利克雷想象单词分配(LDA)模型的话题。

潜在狄利克雷分配(LDA)模型是一个话题模型,发现潜在主题的集合文件和推断单词概率在主题。你可以想象LDA主题使用词云词概率通过显示单词与相应的主题。

负载LDA模型

负载LDA模型factoryReportsLDAModel使用数据集训练的工厂报告详细说明不同的失败事件。一个例子,演示如何适应一个LDA模型到文本数据的集合,看到的使用主题模型分析文本数据。

负载factoryReportsLDAModelmdl

mdl = ldaModel属性:NumTopics: 7 WordConcentration: 1 TopicConcentration: 0.5755 CorpusTopicProbabilities: [0.1587 0.1573 0.1551 0.1534 0.1340……]DocumentTopicProbabilities: [480 x7双]TopicWordProbabilities: [158 x7双]词汇:(“项”“偶尔”“获得”……]TopicOrder:“initial-fit-probability”FitInfo: [1 x1 struct]

使用词云可视化主题

使用可视化主题wordcloud函数。

numTopics = mdl.NumTopics;图t = tiledlayout (“流”);标题(t)“LDA的话题”)为i = 1: numTopics nexttile wordcloud (mdl,我);标题(“主题”+ i)结束

图包含wordcloud类型的对象。图表类型的wordcloud主题标题1。wordcloud类型的图表标题主题2。图表类型的wordcloud主题标题3。4 wordcloud类型的图表标题话题。wordcloud类型的图表标题主题5。wordcloud类型的图表标题主题6。wordcloud类型的图表标题主题7。

另请参阅

tokenizedDocument|fitlda|ldaModel|wordcloud

文本分析工具箱文档

金宝app

开始使用MATLAB的文本分析

立即下载