问题运行fitlda
1视图(30天)
显示旧的评论
我想运行fitlda,以下规范:
*使用格里菲斯和Steyvers(2004)吉布斯抽样算法LDA他们跑
* 12的主题(例如K = 12),
* 50的对称的α/ K(没有更新),
* . 01的对称β(没有更新),和
* 2000次迭代(没有提前终止)。
会是:
numTopics = 12;
mdl = fitlda(袋、numTopics、“详细”,1“InitialTopicConcentration”,50岁,“FitTopicConcentration”假的,“WordConcentration”幅,“LogLikelihoodTolerance”0,“IterationLimit”,2000);
0评论
接受的答案
克里斯托弗Creutzig
2018年12月10日
吉布斯抽样(即包括随机元素。伪随机数发生器),这意味着完全复制2004年的论文的结果和他们需要使用他们的代码
rng
设置。(这也是为什么在简并情况下,你为多个做得到完全不同的答案
fitlda
电话。)
没有查找β在原始论文的定义,我不确定如果你想设置
“WordConcentration”, . 01
或
WordConcentration,幅* bag.NumWords
。
除此之外,调用看起来应该做你问,是的。