cuda统计直方图

栏杆上的红宝石 2017-02-15 01:20:12

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include<stdio.h>
#include<stdlib.h>
#include<windows.h>

typedef struct
{
BYTE r;
BYTE b;
BYTE g;
}RGB;

__global__ void func(BYTE *gray, RGB **img, int width)
{
int i = threadIdx.x;
for (int j = 0; j < width; j++)
{
gray[(img[i][j].r * 38 + img[i][j].g * 75 + img[i][j].b * 15) >> 7]++;
}
}

int main()
{
BITMAPFILEHEADER fileHeader;
BITMAPINFOHEADER infoHeader;
FILE* pfin;
BYTE gray[256] = { 0 };
RGB img[256][256] = { 0 };

cudaError_t cudaStatus;

pfin = fopen("1.bmp", "rb");
//ReadtheBitmapfileheader;
fread(&fileHeader, sizeof(BITMAPFILEHEADER), 1, pfin);
//ReadtheBitmapinfoheader;
fread(&infoHeader, sizeof(BITMAPINFOHEADER), 1, pfin);
//the size of the picture
int size = infoHeader.biWidth*infoHeader.biHeight;
//read the file
fread(img, sizeof(RGB), size, pfin);
int width = infoHeader.biWidth;

BYTE *dev_gray;
RGB **dev_img;

cudaStatus=cudaMalloc((void **)&dev_gray,width*sizeof(BYTE));
if (cudaStatus != cudaSuccess) {
fprintf(stderr, "cudaMalloc failed!");

}
cudaStatus=cudaMalloc((void **)&dev_img,sizeof(img[256][256]));
if (cudaStatus != cudaSuccess) {
fprintf(stderr, "cudaMalloc failed!");

}

cudaMemcpy(dev_gray, gray, width*sizeof(BYTE), cudaMemcpyHostToDevice);
cudaMemcpy(dev_img, img,sizeof(img[256][256]),cudaMemcpyHostToDevice);

func<<<1,width>>>(dev_gray,dev_img, width);

cudaMemcpy(gray, dev_gray, width*sizeof(BYTE),cudaMemcpyDeviceToHost);

cudaFree(dev_gray);
cudaFree(dev_img);

getchar();
return 0;
}
这是我代码为什么最后结果gray数组里面什么都没有啊

...全文

921 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

基于CUDA并行实现图像的直方图统计，opencv简单画出灰度分布直方图曲线分布趋势.

【图像处理·实验二】图像的简单处理技术matlab 1. 实现对图像的亮度、对比度、饱和度、色度的调整。（5 Points） 2. 统计图像的直方图。（1 Point） 3. 实现图像的空域滤波：中值滤波和均值滤波。并选用合适的滤波方法增强如下图像。（5 Points） 4. 实现图像的边缘检测：Roberts 算子和 Sobel 算子。（5 Points） 5. 以下实验选做一个 1) 实现中值滤波的快速算法（5 Points） 2) 利用 CUDA 加速均值滤波（5 Points）

《GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版，由张舒，褚艳利，赵开勇，张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外，还包含有大量的实例供读者学习参考用。下表是各个实例的介绍列表。文件夹对应书中章节备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法，CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法，利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法，利用register reduction 4.7.2 并行归约（缩减）程序 scan 5.1.2 Scan算法，例如计算前缀和 scanLargeArray 5.1.2 Scan算法，可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用，驱动API 实现 sortingNetworks 5.1.1 双调排序网络，处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置，考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加，驱动API实现【备注】以上工程，均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。

GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版，由张舒，褚艳利，赵开勇，张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外，还包含有大量的实例供读者学习参考用。下表是各个实例的介绍列表。文件夹对应书中章节备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法，CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法，利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法，利用register reduction 4.7.2 并行归约（缩减）程序 scan 5.1.2 Scan算法，例如计算前缀和 scanLargeArray 5.1.2 Scan算法，可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用，驱动API 实现 sortingNetworks 5.1.1 双调排序网络，处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置，考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加，驱动API实现

【图像处理·实验二】图像的简单处理技术matlab 1. 实现对图像的亮度、对比度、饱和度、色度的调整。（5 Points） 2. 统计图像的直方图。（1 Point） 3. 实现图像的空域滤波：中值滤波和均值滤波。并选用合适的滤波方法增强如下图像。（5 Points） 4. 实现图像的边缘检测：Roberts 算子和 Sobel 算子。（5 Points） 5. 以下实验选做一个 1) 实现中值滤波的快速算法（5 Points） 2) 利用 CUDA 加速均值滤波（5 Points）

高性能计算

2,408

社区成员

1,024

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章