GPU上的进程速度变慢分析
有个lua的程序在GPU(K80)上跑,一开始的时候平均处理速度为1秒6左右,后来突然变成了6秒左右,速度大大降低;之前试过速度降低的情况是多个进程在同个GPU上跑,但只跑一个进程的时候速度明显是很快的。
但这次仍然只有一个进程(用nvidia-smi命令查看过了),用TOP命令查看了一下,发现有3个僵尸进程,不知道是不是因为僵尸进程影响,杀掉后仍然没有改变……
请教一下,有遇到过相同情况的么?如何解决?或者有哪些可能性?
补充:温度正常,nvidia-smi -a显示43度,slowdown阈值是88度。