Faster-rcnn训练过程中loss_box，训练停止

饿狼搬砖 2019-01-30 09:09:18

Faster-rcnn训练过程中老是loss_box一下掉到零，然后训练就停止了，有没有大佬指导一下

...全文

580 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_44420566 2019-05-04

打赏
举报

回复

引用 6 楼 u010830224 的回复:

[quote=引用 4 楼 weixin_44420566 的回复:]
你好！请问你现在解决这个问题了吗？我现在也是在用faster rcnn进行训练，发现loss_box的值从一开始一直都是0，你也遇到过这样的情况吗？后来是怎么办的了？

这个问题已经解决了，出现这个问题的原因是程序找不到候选框（个人理解），首先检查原始数据，看看label是不是有些不符合规则，比如说：空的标记、标记太小、标记超出范围、长宽比太小或太大等等；第二，要调整学习速率，学习速率不合适也会造成训练过程中找不到候选框的问题；第三，看看是不是运行内存的问题，GPU跑的话中间可能需要设置sleep，避免所有数据之间全部导入，占满内存，会报错内存不住，CPU的话是没有这个问题的，Good Luck![/quote]
好的，感谢，按照你的方案我再试一下。

饿狼搬砖 2019-05-04

打赏
举报

回复

引用 4 楼 weixin_44420566 的回复:

你好！请问你现在解决这个问题了吗？我现在也是在用faster rcnn进行训练，发现loss_box的值从一开始一直都是0，你也遇到过这样的情况吗？后来是怎么办的了？

这个问题已经解决了，出现这个问题的原因是程序找不到候选框（个人理解），首先检查原始数据，看看label是不是有些不符合规则，比如说：空的标记、标记太小、标记超出范围、长宽比太小或太大等等；第二，要调整学习速率，学习速率不合适也会造成训练过程中找不到候选框的问题；第三，看看是不是运行内存的问题，GPU跑的话中间可能需要设置sleep，避免所有数据之间全部导入，占满内存，会报错内存不住，CPU的话是没有这个问题的，Good Luck!

饿狼搬砖 2019-05-04

打赏
举报

回复

这个问题已经解决了，出现这个问题的原因是程序找不到候选框（个人理解），首先检查原始数据，看看label是不是有些不符合规则，比如说：空的标记、标记太小、标记超出范围、长宽比太小或太大等等；第二，要调整学习速率，学习速率不合适也会造成训练过程中找不到候选框的问题；第三，看看是不是运行内存的问题，GPU跑的话中间可能需要设置sleep，避免所有数据之间全部导入，占满内存，会报错内存不住，CPU的话是没有这个问题的，Good Luck!

weixin_44420566 2019-05-03

打赏
举报

回复

你好！请问你现在解决这个问题了吗？我现在也是在用faster rcnn进行训练，发现loss_box的值从一开始一直都是0，你也遇到过这样的情况吗？后来是怎么办的了？

饿狼搬砖 2019-01-31

打赏
举报

回复

total loss一直保持在2左右，并且不在减小，波动在0.8左右

饿狼搬砖 2019-01-30

打赏
举报

回复

引用楼主 u010830224的回复:

Faster-rcnn训练过程中老是loss_box一下掉到零，然后训练就停止了，有没有大佬指导一下

还是我标记的数据有问题

饿狼搬砖 2019-01-30

打赏
举报

回复

引用楼主 u010830224的回复:

Faster-rcnn训练过程中老是loss_box一下掉到零，然后训练就停止了，有没有大佬指导一下

是不是损失函数的分类和回归比例需要调整一下啊

绘制faster rcnn end-to-end训练方式的loss曲线，总的loss图，和4部分bbox loss/cls loss/rpn cls loss/rpn box loss

首先感想来源与pytorch的rpn.py。我们都知道，rpn通过制作lable和targe_ shift来构造rpn loss的计算。那具体是怎么构造的呢? 首先rpn_loss_cls计算：我们应该首先想到的是： rpn_loss_cls = F.cross_entropy(rpn_cls_score, rpn_label) 维度分析 cross_entropy要求输入是Vari...

Faster-RCNN 和 SSD 都是非常非常经典的检测算法，最近回看代码发现挺多小细节没有注意到....再来回温经典吧....我目前看到 Faster-RCNN 写的最仔细的文章链接：https://zhuanlan.zhihu.com/p/31426458本篇基本算是“copy”上文链接一遍，把我认为很重要的地方“加粗”一下，全当自己记笔记了～再次感谢大佬的文章～RPN 阶段：图片+公式来自...

Faster-RCNN源码解析（simple-faster-rcnn-pytorch）这里采用源码地址：点我想了很多种方式详细解析Faster-rcnn的源码，但是Faster-rcnn源码比较复杂，有比较长，功能模块又非常多，一一介绍的话可能会看的晕头转向，所以我还是从预测和训练两个过程种用到的一些功能模块进行一些介绍，这是我个人阅读过程的理解（自己复盘的时候也能快速上手），当然能供大家参考就更好了，如有错误还望指正。整体工作的流程图 1 预测过程 1.1 vgg16网络结构代码位置：./mod

faster-rcnn训练自己的数据集遇到loss为nan

22,302

社区成员

121,734

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章