Google大脑团队提出用于物体检测的语言建模框架

OneFlow深度学习框架
企业官方账号
2021-09-28 12:37:38

#Google大脑团队提出用于物体检测的语言建模框架#  Pix2Seq是一个用于物体检测的简单通用框架。与有关任务的显式集成先验知识的现有方法不同,研究人员将#物体检测# 转换为以观测到的像素输入为条件的语言建模任务。该方法主要基于这样一种直觉,即如果#神经网络# 知道物体的位置和内容,只需要教会该网络如何读取它们。除了使用特定于任务的数据增强之外,该方法对任务做出了最少假设,相较于高度专用化和优化良好的算法,在COCO 数据集上取得了有竞争力的结果。论文:https://arxiv.org/pdf/2109.10852.pdf

 

...全文
753 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
CSDN-Ada助手 2023-01-13
  • 打赏
  • 举报
回复
您可以前往 CSDN问答-人工智能 发布问题, 以便更快地解决您的疑问

219

社区成员

发帖
与我相关
我的任务
社区描述
不止于成为世界上最快的开源深度学习框架
学习其他 企业社区
社区管理员
  • OneFlow深度学习框架
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧