用Caffe进行训练时死机的问题

asaasa66 2016-09-22 09:10:08
请教下大家,有没有遇到过用Caffe进行CNN训练时运行到一半死机的情况,我的显卡是GTX750Ti,Ubuntu14.04系统,之前没有出现过这样的情况,同一个训练任务,之前跑得还是好好的,可以正常完成训练,现在再跑同样的任务,总是在运行几百个iteration后突然就毫无反应了,每次死机时的iteration数都不同,搞了几天了都没解决问题,烦啊。。。
...全文
3641 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_36508372 2017-06-19
  • 打赏
  • 举报
回复
请问大家这个问题解决了吗?我是batch size设置特别小就没事,到十以上就关机重启了,不知道是哪里出了问题
MrTimber 2017-06-11
  • 打赏
  • 举报
回复
楼主的问题解决了吗,我碰到一样的问题了,卡住之后查看GPU信息,显示GPU is lost.Reboot the system to recover the GPU.
yang123jx 2017-05-24
  • 打赏
  • 举报
回复
遇到同样的问题,caffe跑一两个小时就停止退出或重启电脑,请问楼主解决没?
Main Theme 2016-11-10
  • 打赏
  • 举报
回复
我跑MNIST从一开始就死机,不知道为什么,楼主解决了吗?

353

社区成员

发帖
与我相关
我的任务
社区描述
CUDA高性能计算讨论
社区管理员
  • CUDA高性能计算讨论社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧