如何解决词表维度大，softmax计算量大导致的word2vec计算量大的问题？

weixin_28743657 2022-01-13 11:20:34

如何解决词表维度大，softmax计算量大导致的word2vec计算量大的问题？

...全文

2172 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 2022-01-13

打赏
举报

回复 1

1、层次softmax；把N个多分类问题变成logn个二分类问题，可以将softmax转换成sigmoid函数
2、高频词抽样+负采样，将常见的单词组合或者词组作为单个“word”来处理；对高频词单词进行抽样来减少训练样本个数；对优化目标采用“negative sampling”方法，这样每个训练样本的训练只会更新一小部分的模型权重，从而降低计算负担

它避免了对每个训练样本进行全词表的softmax运算，而是在每个训练步骤中随机选取几个负样本（非上下文词），这样大大减少了计算量。这使得Word2vec能够在大型语料库上高效训练。 ### 3. Hierarchical Softmax **...

2. word2vec，该方法能够避免one-hot-code编码的稀疏性，且可以计算每个词之间的距离，得到近义词，反义词等。当然它还不仅如此，比如：king - man + woman = queen 针对第一种bag of words得到每个单词对应的标签...

数据集中的评论会被转化为适合RNN输入的格式，如使用词嵌入（如Word2Vec或GloVe）将每个词转换为固定维度的向量。接下来，我们构建RNN模型。常见的RNN结构包括简单RNN、LSTM（长短时记忆网络）和GRU（门控循环单元...

数据集中的评论会被转化为适合RNN输入的格式，如使用词嵌入（如Word2Vec或GloVe）将每个词转换为固定维度的向量。接下来，我们构建RNN模型。常见的RNN结构包括简单RNN、LSTM（长短时记忆网络）和GRU（门控循环单元...

数据集中的评论会被转化为适合RNN输入的格式，如使用词嵌入（如Word2Vec或GloVe）将每个词转换为固定维度的向量。接下来，我们构建RNN模型。常见的RNN结构包括简单RNN、LSTM（长短时记忆网络）和GRU（门控循环单元...

高通开发者论坛

5,379

社区成员

5,923

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章