在CBOW和Skip-gram中为什么其隐藏层的N维向量可以用来表示词向量?
主要原因是使用了one-hot表示,各个单词之间是相互独立的,每次单词的训练的权重都之只和这个单词有关。
2,852
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧