这个例子展示了如何在潜在狄利克雷想象单词分配(LDA)模型的话题。
潜在狄利克雷分配(LDA)模型是一个话题模型,发现潜在主题的集合文件和推断单词概率在主题。你可以想象LDA主题使用词云词概率通过显示单词与相应的主题。
负载LDA模型factoryReportsLDAModel
使用数据集训练的工厂报告详细说明不同的失败事件。一个例子,演示如何适应一个LDA模型到文本数据的集合,看到的使用主题模型分析文本数据。
负载factoryReportsLDAModelmdl
mdl = ldaModel属性:NumTopics: 7 WordConcentration: 1 TopicConcentration: 0.5755 CorpusTopicProbabilities: [0.1587 0.1573 0.1551 0.1534 0.1340……]DocumentTopicProbabilities: [480 x7双]TopicWordProbabilities: [158 x7双]词汇:(“项”“偶尔”“获得”……]TopicOrder:“initial-fit-probability”FitInfo: [1 x1 struct]
使用可视化主题wordcloud
函数。
numTopics = mdl.NumTopics;图t = tiledlayout (“流”);标题(t)“LDA的话题”)为i = 1: numTopics nexttile wordcloud (mdl,我);标题(“主题”+ i)结束
tokenizedDocument
|fitlda
|ldaModel
|wordcloud