人工智能研究所 2023-09-11 07:37:07
动图详解transformer模型的输入部分,输入部分包括input embedding词嵌入以及positional encoding位置编码,这也是模型数据初始化部分的关键部分 transformer模型并不能直接可以接收我们输入的单词,这个我们把每个单词进行一个不同数字的表示,然后按照数字的embedding操作,把每个数字编码为一个512维度向量,进而可以让神经网络去训练学习 所有的输入会直接进入fransformer的自注意力机制,然后经过自注意力机制后,模型会丢掉输入句子的位置信息,由于不同的单词在不同的句子位置,体现出不同的含义,因此transformer模型加入了位置编码信息#动图详解Transformer
...全文
57 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
头条 人工智能研究所 ,计算机视觉,NLP
transformernlp 个人社区
社区管理员
  • 人工智能研究所
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧