类似于DIT-FFT运算,这里只是取用了8个点,
假设用N来表示点数,用L来表示级数,
每种颜色代表一个线程,比如在第一层,每个线程取的两个数间距为1(2的L-1次方),
读取两个数计算后写回原位,第一级完成后第二级,每个线程取的两个数间隔为2(2的L-1次方),读取两个数计算后写回原位,以此类推,一直到L(L=logN)级。
1.如果用shared memory分段读取,就在级数(L)较高时,这两个数据之间跨较大,没能在一个段中,所以不能读写。
2.只有最后一级是显然满足合并访存的,但是其他级要怎么实现合并访存啊?