矩阵乘的性能问题

sirlii2016 2016-10-24 09:25:47
矩阵乘实现的性能问题.
下面代码示例的两个矩阵乘实现, 一个是gemm_nt, 行列乘; 一个是gemm_nn, 行行乘. 计算量看上去是一样的,
但实测性能一个天上一个地下, 有近7倍+的差距.
在我的电脑上, release模式下, 一个是4.89s, 一个是32.35ms.
我看了一下汇编, 两者也接近, 那为什么会有如此之大的性能差别呢?

#include "stdafx.h"
#include <stdlib.h>
#include <stdio.h>
#include <math.h>
#include <time.h>

float *random_matrix(int rows, int cols)
{
int i;
float *k = (float *)calloc(rows*cols, sizeof(float));
for(i = 0; i < rows*cols; ++i){
k[i] = (float)rand()/RAND_MAX;
}
return k;
}


void gemm_nn(int M, int N, int K, float ALPHA,
float *A, int lda,
float *B, int ldb,
float *C, int ldc)
{
int i,j,k;
for(i = 0; i < M; ++i){
for(k = 0; k < K; ++k){
register float A_PART = ALPHA*A[i*lda+k];
for(j = 0; j < N; ++j){
C[i*ldc+j] += A_PART*B[k*ldb+j];
}
}
}
}

void gemm_nt(int M, int N, int K, float ALPHA,
float *A, int lda,
float *B, int ldb,
float *C, int ldc)
{
int i,j,k;
for(i = 0; i < M; ++i){
for(j = 0; j < N; ++j){
register float sum = 0;
for(k = 0; k < K; ++k){
sum += ALPHA*A[i*lda+k]*B[j*ldb + k];
}
C[i*ldc+j] += sum;
}
}
}

#define _DIM 1000
#define _NUM 10
int _tmain(int argc, _TCHAR* argv[])
{
float *a = random_matrix(_DIM,_DIM);
int lda = _DIM;
float *b = random_matrix(_DIM,_DIM);
int ldb = _DIM;
float *c = random_matrix(_DIM,_DIM);

int i;
clock_t start;

start = clock();
for(i = 0; i<_NUM; ++i){
gemm_nn(_DIM,_DIM,_DIM,1,a,lda,b,ldb,c,_DIM);
}
printf("gemm_nn = %lf s\n",(float)(clock()-start)/CLOCKS_PER_SEC);

start = clock();
for(i = 0; i<_NUM; ++i){
gemm_nt(_DIM,_DIM,_DIM,1,a,lda,b,ldb,c,_DIM);
}
printf("gemm_nt = %lf s\n",(float)(clock()-start)/CLOCKS_PER_SEC);

free(a);
free(b);
free(c);
return 0;
}
...全文
236 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
和我赛跑的人 2016-10-28
  • 打赏
  • 举报
回复
大循环在内小循环在外效率高于小循环在内大循环在外 。 去看C++汇编解密
  • 打赏
  • 举报
回复
gemm_nt中计算了M*N*K次ALPHA*A[i*lda+k]
  • 打赏
  • 举报
回复
两者并不等价, gemm_nn中计算了M*K次A_PART = ALPHA*A[i*lda+k]; gemm_n中计算了M*N*K次ALPHA*A[i*lda+k]
paschen 2016-10-24
  • 打赏
  • 举报
回复
这涉及到 cpu cache 优化

69,371

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧