word2vec在实现CBOW和Skip-gram模型时做了哪些优化?
1:从输入层到隐藏层的映射时直接通过加和求均值的方式进行的,没有使用线性变换加激活函数的方式2:从隐藏层到输出层的计算,采用了层次化softmax,使用了霍夫曼树代替(将其视为一系列的二分类问题)。
2,852
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧