位置编码在self-attention层起到了什么作用?若没有位置编码, 会造成什么影响?位置编码的参数是可学习的还是固定的, 还有哪些位置编码的方式?
并发标识顺序用的
1,332
社区成员
564
社区内容
加载中
欢迎来到 TensorFlow 社区! 这里将:
无论你是社区萌新,还是领域专家,愿你在此学有所获!我们将全程助力开发者玩转 TensorFlow,并利用这一开源平台,轻松构建并部署机器学习模型! 若你感兴趣,请戳右上角,“码”上关注! 【更多渠道请看这里】
试试用AI创作助手写篇文章吧