技术讨论:如何消除指针的歧异性来提高Intel Auto-Vectorization的执行度
技术讨论:如何消除指针的歧异性来提高Intel Auto-Vectorization的执行度
--------------------------------------------------------------------------------
在Intel® C++ Composer XE 2011中,编译器提供了自动向量化的编译开关( -vec(Linux* OS)或/Qvec(Window*OS)):Auto-vectorization。但是并不是所有循环语句都可以被自动向量化的。有些循环由于其中的指针变量的指向的歧异性导致编译器无法对该循环语句进行向量化性能优化,这就需要开发人员根据实际情况说明哪些指针变量可以向量化哪些不能向量化。
请看下面的用例,看看如何进行编译开关设置来提高Vectorization 的执行度;
void matvec(int size1, int size2, FTYPE a[][size2], FTYPE b[], FTYPE x[])
{
int i, j;
for (i = 0; i < size1; i++) {
b[i] = 0;
for (j = 0;j < size2; j++) {
b[i] += a[i][j] * x[j];
}
}
}