计算核函数的运行次数

GPU小码农 2016-11-03 03:33:09

哪位大神帮忙改改，我就像算算核函数运行了几次，但是老是出错
感觉不太明白核函数到底是怎么运行的，目前正在学习《GPU高性能编程CUDA实战》
到底开了几个线程？还有核函数里面为什么又用了while循环来计算索引，没搞懂啊！！求大神指点啊！！

#define N (33 * 1024)



int count = 0;



__global__ void  add(int *a , int *b , int* c ,int count_)

{

	int tid = threadIdx.x + blockIdx.x * blockDim.x;//获得线程索引

	//			printf("tid = %d\n",tid);

	count_ += 1;//计算函数运行了几次

	while( tid < N)//必须检查是否在正确的偏移范围类内

	{

			c[ tid ] = a[ tid ] + b[ tid ];

			tid += blockDim.x * gridDim.x;

	}

}



int main()

{

	int a[N] , b[N] , c[N];

	int *dev_a, *dev_b , *dev_c;

	int *n = 0;

	int n_result = 2;

	//在GPU上分配内存

	cudaMalloc( (void**)&dev_a , N * sizeof(int ) );

	cudaMalloc( (void**)&dev_b , N * sizeof(int ) );

	cudaMalloc( (void**)&dev_c , N * sizeof(int ) );

	cudaMalloc( (void**)&n , sizeof(int ) );



	//在CPU上为数组a,b赋初值

	for(int i = 0; i < N; i++)

	{

		a[i] = -i;

		b[i] = i * i;		 

	}

	//将数组a, b 复制到GPU上去计算

	cudaMemcpy( dev_a , a , N * sizeof(int) , cudaMemcpyHostToDevice);

	cudaMemcpy( dev_b , b , N * sizeof(int) , cudaMemcpyHostToDevice);



	add<<<128,128>>>( dev_a , dev_b , dev_c, *n);

	//计算完毕，将数组C从GPU复制到CPU

	cudaMemcpy( c , dev_c , N * sizeof(int) , cudaMemcpyDeviceToHost);

	//计算完毕，将n从GPU复制到CPU

	cudaMemcpy( &count , n , sizeof(int) , cudaMemcpyDeviceToHost);

	//验证GPU确实完成了我们要求的工作

	bool success = true;

	//显示结果

	for(int  i = 0; i < N ; i++)

	{

		if( ( a[i] + b[i]) != c[i] )

		{

			printf("error\n");

			success = false;

		}

		//printf(" %d + %d = %d \n", a[i] , b[i] , c[i]);

	}

	if(success)

		printf("we did it ! \n");

	//最后记得释放在GPU上分配的内存

		printf("n = %d", count);



	cudaFree( dev_a );

	cudaFree( dev_b );

	cudaFree( dev_c );

	cudaFree( n );



	getchar();

	return 0;

}

...全文

346 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

kakjj123 2016-11-04

打赏
举报

回复

kernel内用原子加

函数计算作为后容器时代的重要服务，在各种解决方案中层出不穷。可以预见的一点，在5G时代中，函数计算作为各个服务模块的桥梁，将会大幅度提升研发效率，降低研发总体拥有成本TCO，对整个IT行业的管理模式产生深远的影响。阿里云作为国内领先的公有云平台，在2016年推出了函数计算服务，目前在应用方面越来越广泛。本次课程重点介绍阿里云函数计算服务的使用方法、帮助听众了解云计算无服务化的趋势，了解函数计算的应用场景，以及如何在实践中进行函数计算的开发。同时，结合图片大小变更及人脸识别的应用案例，让听众从真正的实践中学习函数计算的使用。

有人说核函数与内积是等价的，我赞同这一观点。当我们将低维空间的数据映射到高维空间的时候，我们甚至不需要知道映射函数是什么，就算知道了又能怎么样，它只会给我们带来计算的复杂度。我们需要的是这种类型的核函数可以在低维空间中用怎样的形式表现出来，因为低维空间的表达式才是容易计算的。可以说，内积是核函数实现的一种技巧。没有内积，就没有核函数；没有核函数，也就体现不出内积的价值。

介绍核函数的不同类型、核函数在不同数据集上的表现，在rbf上表现最好。以及核函数的缺点，提醒我们需要将数据进行统一量纲处理。

数据可视化上篇文章介绍了线性不可分和线性可分两种情况，以及五种核函数，线性核函数（linear），多项式核函数（poly），高斯核函数（rbf），拉普拉斯核函数（laplace）和Sigmoid核函数，基于《机器学习实战》的数据，我们使用各种核函数对数据尝试分类，下面看一下效果如何.首先看一下我们的数据集：.........

文章目录系列文章支持向量机SVM算法1 SVM算法简介1.1 引入1.2 算法定义2 SVM算法原理2.1 线性可分支持向量机2.2 SVM计算过程与算法步骤(有点难，我也没理解透，建议跳过)推导目标函数目标函数求解拉格朗日乘数法对偶问题整体流程确定3 SVM的损失函数4 SVM的核方法4.1 什么是核函数4.2 常见核函数5 SVM回归6 SVM算法API介绍6.1 SVM算法API综述6.2 SVC6.3 NuSVC6.4 LinearSVC7 案例：数字识别器7.1 案例背景介绍7.2 数据介绍7.3

580

社区成员

2,919

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章