内存拷贝的问题
请教一个问题:我需要大量的矩阵运行,而且这些矩阵都是大矩阵(每个矩阵400M),那么我把这些数据up和down的时候就会有明显的耗时,请问给要怎么处理该问题呢?
我用cubals库来做矩阵的运算,而且是批量的运算就是一次运算几十个,这样每次有传递几个G的数据
我现在想到的是stream和分页锁定内存。
但是stream测试的结果显示没有任何提升,是不是我用错了,
分页锁定可以提高2倍的速度,但是对cpu的内存消耗太大,放在系统里可能会影响整个系统的性能。
请教各位怎么处理这个问题?