patch成为了ALL You Need?挑战ViT、MLP-Mixer的简单模型来了

OneFlow深度学习框架
企业官方账号
2021-10-08 14:43:47

#Vision Transformer#等视觉模型的强大性能,是来自于#Transformer# 架构,还是patch?研究者提出了简单 ConvMixer 模型进行证明,直接将 patch 作为输入,实验表明,ConvMixer 性能优于 ResNet 等经典视觉模型,并且在类似的参数计数和数据集大小方面也优于 ViT、MLP-Mixer 及其一些变体。论文:https://openreview.net/pdf?id=TVHS5Y4dNvM;代码:https://github.com/tmp-iclr/convmixer

 

...全文
345 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
CSDN-Ada助手 2023-01-13
  • 打赏
  • 举报
回复
您可以前往 CSDN问答-人工智能 发布问题, 以便更快地解决您的疑问

219

社区成员

发帖
与我相关
我的任务
社区描述
不止于成为世界上最快的开源深度学习框架
学习其他 企业社区
社区管理员
  • OneFlow深度学习框架
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧