神经网络实现image caption

zhanghuiming1215 2018-06-28 10:49:56
大家,现在有没有在研究神经网络实现image caption的,那个网络参数一般都怎么设置比较合理呀,求大神带,自己才疏浅薄
...全文
201 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
利用深度卷积网络的图像超分辨率 Image Super-Resolution Using Deep Convolutional Networks (2016) 作者C. Dong et al. 摘要:我们提出了一种用于单图像超分辨率(SR)的深度学习方法。 我们的方法直接学习低/高分辨率图像之间的端对端映射。 该映射被表示为以低分辨率图像作为输入并输出高分辨率图像的深度卷积神经网络(CNN)。 我们进一步表明,传统的基于稀疏编码的SR方法也可以看作是一个深层卷积网络。 但不同于传统的分别处理每个组件方法,我们的方法联合优化了所有层。 我们的深度CNN具有轻量的结构,但展示了最先进的恢复能力,并实现实际在线使用的高速度。 我们探索不同的网络结构和参数设置,以实现性能和速度之间的权衡。此外,我们扩展我们的网络,以同时处理三个color channels,并显示了更好的整体重建质量。 基于DNN的艺术风格生成算法 A neural algorithm of artistic style (2015) 作者 L. Gatys et al. 可生成图像说明的深度视觉-语义校准模型 Deep visual-semantic alignments for generating image descriptions (2015) 作者A. Karpathy and L. Fei-Fei 显示、注意以及说明:带有视觉注意模型的神经图像说明生成 Show, attend and tell: Neural image caption generation with visual attention (2015) 作者K. Xu et al. 显示和说明:一个神经图像说明生成器 Show and tell: A neural image caption generator (2015) 作者O. Vinyals et al. 用于视觉识别和描述的长期循环卷积网络 Long-term recurrent convolutional networks for visual recognition and description (2015) 作者J. Donahue et al. VQA:视觉问答 VQA: Visual question answering (2015) 作者S. Antol et al. DeepFace:在面部验证任务中接近人类表现 DeepFace: Closing the gap to human-level performance in face verification (2014) 作者Y. Taigman et al. 利用卷积神经网络进行大规模视频分类 Large-scale video classification with convolutional neural networks (2014) 作者A. Karpathy et al. DeepPose:利用深度神经网络评估人类姿势 DeepPose: Human pose estimation via deep neural networks (2014) 作者A. Toshev and C. Szegedy 用于视频中动作识别的双流卷积网络 Two-stream convolutional networks for action recognition in videos (2014) 作者K. Simonyan et al. 用于人类动作识别的3D 卷积神经网络 3D convolutional neural networks for human action recognition (2013) 作者S. Ji et al.

590

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧