如何解决词表维度大,softmax计算量大导致的word2vec计算量大的问题?
1、层次softmax;把N个多分类问题变成logn个二分类问题,可以将softmax转换成sigmoid函数2、高频词抽样+负采样,将常见的单词组合或者词组作为单个“word”来处理;对高频词单词进行抽样来减少训练样本个数;对优化目标采用“negative sampling”方法,这样每个训练样本的训练只会更新一小部分的模型权重,从而降低计算负担
2,852
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧