如何 提高C++ 多维数组访问速度

碎碎念 2013-11-20 04:14:07
rt,假设数组维度为4,A*B*C*D,大小 512*512*100*120(即A=521,B=512,C=100, D=120),在堆上分配内存,如果分配和管理这部分内存能够使得,按不同维度来访问数组都能获得较快的访问速度?比如说,按照如下方式分配内存:
int ****A;
A = new int ***[512];
for(int i = 0; i < 512; i++)
{
A[i] = new int**[512];
}
for(int i = 0; i < 512; i++)
for(int j = 0; j < 512; j++)
{
A[i][j] = new int*[100];
}

for(int i = 0; i < 512; i++)
for(int j = 0; j < 512; j++)
for(int k = 0; k < 100; k++)
{
A[i][j][k] = new int[120];
}
按照维度D访问数组,由于最后一个维度,所以访问的内存地址是连续的,缓存命中率较高,但是按照维度C,访问数组,由于内存地址的不连续,会导致内存颠簸,有什么方式可以提高多维数组的访问速度?可以使用不同的内存分配方式,主要是需要按照不同维度访问数组都可以获得较高的访问速度速度?
...全文
1332 14 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
赵4老师 2013-11-25
  • 打赏
  • 举报
回复
引用 13 楼 lanxue_1988 的回复:
[quote=引用 12 楼 zhao4zhong1 的回复:] 8、9楼正解!
假如多维度A,C访问,遍历A[i][0][j][0],这样访问的内存跳跃较大,是不连续的,如果把数组的维度做一下调整变成B*D*A*C,这样遍历A[0][0][i][j],访问的速度会有提升,有没有好的办法对数组的维度做出调整?[/quote] 无需调整。 不要低估CPU内部两级Cache的智商!
碎碎念 2013-11-25
  • 打赏
  • 举报
回复
引用 12 楼 zhao4zhong1 的回复:
8、9楼正解!
假如多维度A,C访问,遍历A[i][0][j][0],这样访问的内存跳跃较大,是不连续的,如果把数组的维度做一下调整变成B*D*A*C,这样遍历A[0][0][i][j],访问的速度会有提升,有没有好的办法对数组的维度做出调整?
赵4老师 2013-11-22
  • 打赏
  • 举报
回复
8、9楼正解!
碎碎念 2013-11-22
  • 打赏
  • 举报
回复
引用 2 楼 dyw 的回复:
C/C++ tip: How to loop through multi-dimensional arrays quickly http://nadeausoftware.com/articles/2012/06/c_c_tip_how_loop_through_multi_dimensional_arrays_quickly
谢啦~ 还有个问题,对于,10楼我说的问题,有没有什么好的解决方式?~
碎碎念 2013-11-22
  • 打赏
  • 举报
回复
引用 3 楼 supermegaboy 的回复:
http://blog.csdn.net/code_crash/article/details/4854899 你现在的做法是先组合地址再分配内存,内存是不连续的,可以改为先分配内存再组合地址,可能可以提高命中率。 此外,这些数组的元素需要参与计算么?是的话,可以考虑表达式模板减少临时对象,提高性能。
博客写得很受用~谢啦 还有个问题。 采用如下方式

int *pBuf = new int[512*512*120*100];
int **p1 = new int*[512*512*120];
int ***p2 = new int**[512*512];
int ****A = new int***[512];
for(int i = 0; i<100; i++)
   p1[i] = pBuf + 512*512*120*i;
for(int i = 0; i< 120;i++)
   p2[i]=p1+512*512*i;
for(int i =0; i<512;i++)
   A[i]=p2+512*i;
分配的地址是连续的,假如,程序在某段时间内,频繁访问维度AC,比如遍历A[i][0][j][0],遍历i,j时,访问的内存不是连续的,这个时候有没有什么办法能够提高访问速度? 之前,我想得是在访问维度AC之前,可以将数组维度变换为B*D*A*C,然后对维度A*C进行访问,但是没有想出什么好的办法对数组维度进行变换,有没有什么好的办法处理这种情况?
赵4老师 2013-11-20
  • 打赏
  • 举报
回复
ARR[i*512*100*120+j*100*120+k*120+l]='V';//ARR[i][j][k][l]='V'
赵4老师 2013-11-20
  • 打赏
  • 举报
回复
纠正上帖:
int *ARR=new int[512*512*100*120];
int *A,*B,*C,*D;

for (A=ARR;A<ARR+512*512*100*120;A+=512*100*120) A[0]='A';//ARR[0..511][0     ][0   ][0     ]='A'
for (B=ARR;B<ARR+  1*512*100*120;B+=    100*120) B[0]='B';//ARR[0     ][0..511][0   ][0     ]='B'
for (C=ARR;C<ARR+      1*100*120;C+=      1*120) C[0]='C';//ARR[0     ][0     ][0.99][0     ]='C'
for (D=ARR;D<ARR+          1*120;D+=          1) D[0]='D';//ARR[0     ][0     ][0   ][0..119]='D'
赵4老师 2013-11-20
  • 打赏
  • 举报
回复
int *ARR=new int[512*512*100*120];
int *A,*B,*C,*D;

for (A=ARR;A<A+512*512*100*120;A+=512*100*120) A[0]='A';
for (B=ARR;B<B+  1*512*100*120;B+=    100*120) B[0]='B';
for (C=ARR;C<C+      1*100*120;C+=      1*120) C[0]='C';
for (D=ARR;D<D+          1*120;D+=          1) D[0]='D';
gz_qmc 2013-11-20
  • 打赏
  • 举报
回复
typedef struct X { int V[120]; }MX; typedef struct Y { MX V[100]; }MY; typedef struct Z { MY V[512]; }MZ; typedef struct N { MZ V[512]; }MN; MN *A=new MN; A->V[i].V[j].V[k].V[n]=7788;
Exaybachay 2013-11-20
  • 打赏
  • 举报
回复
提高速度就是快速的寻址, 多维数组类似数据库表了, 你建索引
gz_qmc 2013-11-20
  • 打赏
  • 举报
回复
A[i][j][k][n] 表示为 A[512*i+512*j+100*k+n];
dyw 2013-11-20
  • 打赏
  • 举报
回复
飞天御剑流 2013-11-20
  • 打赏
  • 举报
回复
http://blog.csdn.net/code_crash/article/details/4854899 你现在的做法是先组合地址再分配内存,内存是不连续的,可以改为先分配内存再组合地址,可能可以提高命中率。 此外,这些数组的元素需要参与计算么?是的话,可以考虑表达式模板减少临时对象,提高性能。
gz_qmc 2013-11-20
  • 打赏
  • 举报
回复
int *X=new int(512*512*100*120);
一组新的多维数组模板类 by chen3feng(RoachCock@smth) email: chen3feng@163.com, chen3fengx@163.com, chen3fengx@hotmail.com [引言] 在C/C++开发中,多维数组是一个让很多人感到棘手的问题.原因是C/C++中,多维数组被看 作是数组数组. 在向函数传递参数的时候,多维数组经常让人感到是麻烦的制造者,通常都是传递首地址 和每一维的大小: void foo(int *,int ,int);; int a[10][10];; foo(&a[0][0],10,10);; //... 十分的麻烦,在函数中访问时也得自己用乘法来计算元素的位置,更是十分麻烦. C99标准推出了可变大小的多维数组,当然,实现该标准的编译器还不多,但是也从一个方 面说明了变量大小的多维数组是很有用的. C++标准直到现在还不支持,明年(2003年)的新标准也不知道会不会加进去.但是C++程序 员自己有办法,利用C++的模板,运算符重载等技巧,完全可以构建出方便实用的多维数组类 我抢在明年之前做出这组模板类,也希望即使新标准增加了变量大小的多维数组,我的工 作也仍有一些意义, :) 另外,多维数组的空间是连续的,这跟用vector of vector实现的不一样,可以用迭代器 从头到脚挨个摸一遍. boost库也提供了多维数组类,当然还有别的几个数组类.我感觉boost多维数组类的缺点 就是只支持动态数组,对静态和动态数组没有一个统一的非GP的接口,因此我着重于这方 面的改进, [简介] 该组类有以下几个类模板组成 1. template <;typename T, size_t DimNum>; class array_base;; 该类是其他几个数组类的基类 // 由于编译器对C++标准实现参差不齐的原因,该类实际 上不是根类,不过应用中不需要知道这一点. 提供了基本的功能,比如[]运算符,迭代器的类型声明,迭代器的获取,value_type等的定 义等 等 2. template <;typename T, size_t d1, size_t d2 = -1, size_t d3 = -1>; class static_array;; 静态的数组类,从array_base派生而来,因此除了兼容也是由array_base派生出来的其他 类外,还有自己的特点,就是提供了一个elements的public成员,直接暴露给用户,访问 速度可以很快. 3. template<;typename T,size_t DimNum, typename A=std::allocator<;T>; >; class dynamic_array;; //:public array_base<;T, DimNum>; 看得出也是从array_base派生的,另外,他是可以resize的.还支持reserve等STL容器的操 作. 4. template <;typename T, size_t DimNum, typename A=std::allocator<;T>; >; class shared_array;; //: public array_base<;T, DimNum>; 就是支持引用计数的动态数组啦.不过刚写了个外皮,内容还没开工,因为我最近要回家. sorry! [用法] 先要包含各自的头文件: #include ";static_array.hpp"; #include ";dynamic_array.hpp"; #include ";shared_array.hpp"; 1.然后就可以定义对象 cfc::static_array<;int,10>; sa1;; cfc::static_array<;int,10, 10>; sa2;; cfc::static_array<;int,10, 10, 10>; sa3;; cfc::dynamic_array<;int, 1>; da1(cfc::extents[10],10);; cfc::dynamic_array<;int, 2>; da2(cfc::extents[10][10], 10);; cfc::dynamic_array<;int, 3>; da3(cfc::extents[10][10][10], 10);; cfc::shared_array<;int,1>; sha1(cfc::extents[10]]);; cfc::shared_array<;int,2>; sha2(cfc::extents[10][10]);; cfc::shared_array<;int,3>; sha3(cfc::extents[10][10][10]);; extents是一个数组的维度生成器,用起来的很方便,跟boost学的,不过没仔细看它的实现 ,我觉得我的也不错,哈哈 2.访问元素: sa1[0] = 0;; da1[0] = 0;; sa2[0][0] = 0;; da2[0][0] = 0;; sa3[0][0][0] = 0;; da3[0][0][0] = 0;; 3.比较相等与否: bool f;; f = sa1==sb1;; f = da1==da1;; f = sa1==da1;; // 说明:只提供了==和!=,别的没提供,我觉得别的意义大 4.交换: cfc::swap(da1,db1);; cfc::swap(sa1,sb1);; cfc::swap(sa1,db1);; //说明:动态数组的交换很高效,换个指针而已, :) 5.resize: da3.resize(cfc::extents[10][100][1]);; da3.resize(cfc::extents[10][50][1]);; da3.resize(cfc::extents[10][10][20]);; da3.resize(cfc::extents[10][10][10]);; //说明:只有动态数组才能resize, 还有将来的shared_array, zz 6.赋值: da3 = db3;; sa1 = sb1;; da1 = db1;; 静态数组维度不一样不能赋值,否则会引起编译错误 动态数组和丢失了静态大小成为了array_base的数组维度不一样时,赋值引发 std::length_error异常,可以捕捉到, 比较也是这样 7.作为函数的参数 还举开头的那个例子 void foo(array_base<;int,2>; &a) { a[0][0]=10;; } 8.重要概念 <;子数组>; 高维数组的子类型,也就是低一维的数组. 子数组的类型为array_base,支持array_base的所有操作,但是不再支持原来数组的特定 操作子数组由[]运算符得到, sa3[0] da3[0] //类型均为array_base<;int,2>; 子数组还可以在取子数组 da3[0][1];;//类型为array_base<;int,1>; [性能] 三维大小均为100的静态,动态,原生数组以及boost::multi_array.以三重循环每次隔一个 填充, 我测试的结果,速度大概是原生数组的60%,boost数组的速度是原生数组的1/5,因此速度 大概是boost的3倍. 如果用迭代器顺序访问的话,跟原生数组相比就区别不大了.但是代码要好写一点,而且直 接支持STL算法. [实现与移植] 由于要兼顾各种编译器,而且是在VC6上做的,因此像模板偏特化等特性都不能用,需要变 通,因此相当繁琐,由此可见一个好的编译器多么重要啊. 不过话说回来,这样的代码移植性才好呢.想想连VC6都能编译的代码,移植性应该不错, :) [后记] 这是对以前的那个多维数组类的扩充与改进,增加了不少功能,去掉了不少限制, 现在静态数组的最大维数做到了3,动态数组的维数不限//你需要多高维数的?维数越高越 慢, :) 由于时间不多,精力和水平有限,其中的缺点和错误欢迎指正,也十分欢迎哪位能帮我进一 步提高访问速度. 谢谢! 附带测试程序,其中包括与boost::multi_array<;>;的速度比较代码. //the end. ^=^

65,187

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧