Co-Occurence Vector(Latent Semantic Analysis)是否具有明显的优缺点?
优点:相比于前几种基于频率的方法,它保留了一定的语义信息,考虑到了局部的顺序。缺点:1:维度过大,共现矩阵难以处理,可以通过SVD,PCA等进行降维操作,但是计算量会很大2:加入新的单词后,需要重新计算整个共现矩阵,拓展性差
2,852
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧