我最近在写代码的时候用到了FFT,在matlab中一个2097152点的数据进行FFT用了0.15S,在cuda中用CUFFT库中的C2C,用了0.14S,只相差了0.1S,请问本来就是这样子的吗?可是我在网上查资料发现CUFFT按理说应该提速100倍以上,有没有大佬知道是怎么回事?我的CUFFT的计时用的是cudaevent那一种计时方式,会不会是计时的问题?
589
社区成员
2,924
社区内容
加载中
试试用AI创作助手写篇文章吧