在LDA 的实验中,为什么我得到的perplexity值与论文里的不符
我在学习LDA(D.Blei,2003)这个模型时,也重新做了一下求perplexity的实验。这个实验的数据集是 Associated Press,采用的代码是D.Blei所提供的代码(http://www.cs.princeton.edu/~blei/lda-c/index.html),但最后得出的perplexity值与论文中Figure9(bottom)的perplexity值不符。
我任意选取一组90%的文档为训练样本,剩余的为测试集,分别取k值为5,10,20,50,100,200,按照论文7.1节里给出的计算公式求出perplexity值,大致是在6500到5500之间,且在k从50到100的区间内,perplexity值会增大。但是论文里的perplexity值是在4500到3000之间,且k从50以后就基本保持不变。