求助:主机端分配内存、主机与设备端、设备与主机端数据传输速度慢的问题
我所用的硬件和软件条件
显卡:
NVIDIA GeForce 8600 GT
驱动及其它:
cudatoolkit_2.3_win_32
cudasdk_2.3_win_32
cudadriver_2.3_winxp_32_190.38_general
电脑配置:
1G内存,1.99GHz
操作系统:
XP SP3
我的程序测试结果
分配设备端内存耗时43ms:cudaMalloc((void**)&d_ZoomImg, 3400*3400);
分配主机端内存耗时9ms:unsigned char* h_ZoomImg = (unsigned char *)malloc(size);
设备端数据拷回到主机端耗时20ms:cutilSafeCall( cudaMemcpy( h_ZoomImg, d_ZoomImg, size, cudaMemcpyDeviceToHost) );
内核程序耗时27ms;
我的问题
1.在以上处理中,所花费的时间是否合理?
2.在资料中,看到GTX260的一些优势:
1)在host-to-device,device-to-host的带宽比8600GT、9600GT要高
2)而且计算能力为1.3(支持zero-copy技术)
3)SM数量为24
如果我用GTX260显卡,想改善主机端内存分配、主机与设备端、设备与主机端数据传输的速度,效果会很明显吗,GTX260现在市场价大概1000左右吧