问题运行fitlda

1视图(30天)
Stephen Bruestle
Stephen Bruestle 2018年12月6日
评论道: Stephen Bruestle2020年6月11日
我想运行fitlda,以下规范:
*使用格里菲斯和Steyvers(2004)吉布斯抽样算法LDA他们跑
* 12的主题(例如K = 12),
* 50的对称的α/ K(没有更新),
* . 01的对称β(没有更新),和
* 2000次迭代(没有提前终止)。
会是:
numTopics = 12;
mdl = fitlda(袋、numTopics、“详细”,1“InitialTopicConcentration”,50岁,“FitTopicConcentration”假的,“WordConcentration”幅,“LogLikelihoodTolerance”0,“IterationLimit”,2000);

接受的答案

克里斯托弗Creutzig
克里斯托弗Creutzig 2018年12月10日
吉布斯抽样(即包括随机元素。伪随机数发生器),这意味着完全复制2004年的论文的结果和他们需要使用他们的代码 rng 设置。(这也是为什么在简并情况下,你为多个做得到完全不同的答案 fitlda 电话。)
没有查找β在原始论文的定义,我不确定如果你想设置 “WordConcentration”, . 01 WordConcentration,幅* bag.NumWords
除此之外,调用看起来应该做你问,是的。
3评论
Stephen Bruestle
Stephen Bruestle 2020年6月11日
我认为你只是插入50。
说,我从来没有能够得到结果类似于GibbsLDA + +程序。似乎有某种优化仍在继续。最后,我最终使用吉布斯+ +,我有更多的信心。
如果你写一篇学术论文,我建议吉布斯+ +,因为它是更好的记录和使用在许多学术著作。如果你真的想使用MatLab,原始代码格里菲斯和Steyvers MatLab代码。
这是一个耻辱fitlda不正确记录。没有精确的经验每个函数的定义,fitlda似乎毫无价值的学术目的。

登录置评。

更多的答案(0)

类别

找到更多的在统计和机器学习工具帮助中心文件交换

下载188bet金宝搏


释放

R2018b

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!