DSCORES=变换(ldamdl,,,,文件)transforms documents into the latent Dirichlet allocation (LDA) topic probability space of LDA modelldamdl。The rows ofDSCORES是文档的主题混合物表示。
输入文档,指定为至kenizedDocument数组,字符串数组的话,或细胞的数组character vectors. If文件是一个至kenizedDocument,那么它必须是列向量。如果文件是一个string array or a cell array of character vectors, then it must be a row of the words of a single document.
指定可选的逗号分隔对名称,价值arguments.姓名是参数名称和Value一世s the corresponding value.姓名必须出现在引号中。您可以按任何顺序指定几个名称和值对参数姓名1,Value1,...,NameN,ValueN。
Example:“迭代限制”,,,,200将迭代限制设置为200。
笔记
这些名称值对仅当输入模型是一个ldamodel目的。
文件-Orientation of documents “行”(默认)|'列'
单词计数矩阵中文档的方向,指定为逗号分隔对“文件”以及以下一个:
“行”- 输入是单词计数的矩阵,其行与文档相对应。
'列'– Input is a transposed matrix of word counts with columns corresponding to documents.
This option only applies if you specify the input documents as a matrix of word counts.
笔记
如果you orient your word count matrix so that documents correspond to columns and specify“文档”,“列”,那么您可能会大大减少优化执行时间。
迭代限制-最大迭代次数 100(默认)|正整数
最大迭代次数,指定为逗号分隔对“迭代限制”and a positive integer.
Example:“迭代限制”,,,,200
LogLikelihoodTolerance-Relative tolerance on log-likelihood 0.0001(默认)|正标量
Relative tolerance on log-likelihood, specified as the comma-separated pair consisting of“ loglikelihoodhoodtolerance'and a positive scalar. The optimization terminates when this tolerance is reached.