跪求CUDA 内核的时间测量
各位大神,对CUDA不熟,有个问题,不知怎么解决,跪求解决方法。
问题描述:定义了一个kernel (名为function),里面调用了两函数(function1、function2),现在想知道function2的计算时间,怎么办,貌似用cudaEvent_t不可以。
__global__ void function()
{
function1();
function2();
}
__device__ void function1(){
...........
.....
}
_devide__ void function2(){
......
......
}