Faster-rcnn训练过程中loss_box,训练停止

饿狼搬砖 2019-01-30 09:09:18
Faster-rcnn训练过程中老是loss_box一下掉到零,然后训练就停止了,有没有大佬指导一下
...全文
580 7 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
weixin_44420566 2019-05-04
  • 打赏
  • 举报
回复
引用 6 楼 u010830224 的回复:
[quote=引用 4 楼 weixin_44420566 的回复:]
你好!请问你现在解决这个问题了吗?我现在也是在用faster rcnn进行训练,发现loss_box的值从一开始一直都是0,你也遇到过这样的情况吗?后来是怎么办的了?

这个问题已经解决了,出现这个问题的原因是程序找不到候选框(个人理解),首先检查原始数据,看看label是不是有些不符合规则,比如说:空的标记、标记太小、标记超出范围、长宽比太小或太大等等;第二,要调整学习速率,学习速率不合适也会造成训练过程中找不到候选框的问题;第三,看看是不是运行内存的问题,GPU跑的话中间可能需要设置sleep,避免所有数据之间全部导入,占满内存,会报错内存不住,CPU的话是没有这个问题的,Good Luck![/quote]
好的,感谢,按照你的方案我再试一下。
饿狼搬砖 2019-05-04
  • 打赏
  • 举报
回复
引用 4 楼 weixin_44420566 的回复:
你好!请问你现在解决这个问题了吗?我现在也是在用faster rcnn进行训练,发现loss_box的值从一开始一直都是0,你也遇到过这样的情况吗?后来是怎么办的了?

这个问题已经解决了,出现这个问题的原因是程序找不到候选框(个人理解),首先检查原始数据,看看label是不是有些不符合规则,比如说:空的标记、标记太小、标记超出范围、长宽比太小或太大等等;第二,要调整学习速率,学习速率不合适也会造成训练过程中找不到候选框的问题;第三,看看是不是运行内存的问题,GPU跑的话中间可能需要设置sleep,避免所有数据之间全部导入,占满内存,会报错内存不住,CPU的话是没有这个问题的,Good Luck!
饿狼搬砖 2019-05-04
  • 打赏
  • 举报
回复
这个问题已经解决了,出现这个问题的原因是程序找不到候选框(个人理解),首先检查原始数据,看看label是不是有些不符合规则,比如说:空的标记、标记太小、标记超出范围、长宽比太小或太大等等;第二,要调整学习速率,学习速率不合适也会造成训练过程中找不到候选框的问题;第三,看看是不是运行内存的问题,GPU跑的话中间可能需要设置sleep,避免所有数据之间全部导入,占满内存,会报错内存不住,CPU的话是没有这个问题的,Good Luck!
weixin_44420566 2019-05-03
  • 打赏
  • 举报
回复
你好!请问你现在解决这个问题了吗?我现在也是在用faster rcnn进行训练,发现loss_box的值从一开始一直都是0,你也遇到过这样的情况吗?后来是怎么办的了?
饿狼搬砖 2019-01-31
  • 打赏
  • 举报
回复
total loss一直保持在2左右,并且不在减小,波动在0.8左右
饿狼搬砖 2019-01-30
  • 打赏
  • 举报
回复
引用 楼主 u010830224的回复:
Faster-rcnn训练过程中老是loss_box一下掉到零,然后训练就停止了,有没有大佬指导一下
还是我标记的数据有问题
饿狼搬砖 2019-01-30
  • 打赏
  • 举报
回复
引用 楼主 u010830224的回复:
Faster-rcnn训练过程中老是loss_box一下掉到零,然后训练就停止了,有没有大佬指导一下
是不是损失函数的分类和回归比例需要调整一下啊

22,302

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 疑难问题
社区管理员
  • 疑难问题社区
  • 尘觉
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧