CUDA 6.0已经支持了内存统一寻址,只不过是从软件层面减少了开发人员的工作量,实际的执行过程仍然是将数据拷贝到Device端来执行的。Maxwell架构的GPU传说是真正意义上从硬件层面实现内存统一寻址,不过准确的消息仍然要等官方消息,毕竟现在Maxwell仍没有几款GPU。如果真的实现了硬件统一寻址,传输的效率会有所提高的~
对于第二个问题,本人了解的也不是很多,没办法回答你,我暂时了解到的也只是这么一个特性需要64位的CUDA版本。不过我想随着CUDA版本的升级,64位和32位应该不是什么重要的区别~