在LDA 的实验中,为什么我得到的perplexity值与论文里的不符

xwx629530 2013-06-29 05:40:40
我在学习LDA(D.Blei,2003)这个模型时,也重新做了一下求perplexity的实验。这个实验的数据集是 Associated Press,采用的代码是D.Blei所提供的代码(http://www.cs.princeton.edu/~blei/lda-c/index.html),但最后得出的perplexity值与论文中Figure9(bottom)的perplexity值不符。
我任意选取一组90%的文档为训练样本,剩余的为测试集,分别取k值为5,10,20,50,100,200,按照论文7.1节里给出的计算公式求出perplexity值,大致是在6500到5500之间,且在k从50到100的区间内,perplexity值会增大。但是论文里的perplexity值是在4500到3000之间,且k从50以后就基本保持不变。


...全文
2416 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
slp39 2014-06-01
  • 打赏
  • 举报
回复
我想问一下你是如何计算perplexity的,我的毕设与这个相关,不好意思 没回答你问题,还要问你

246

社区成员

发帖
与我相关
我的任务
社区描述
讨论 Informatica 数据集成相关技术、数据隐私保护相关技术
社区管理员
  • 数据集成社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧