CL_OUT_OF_RESOURCES 很纳闷啊

一只小可爱啊 2017-05-24 05:27:48
cl代码如下:
__kernel void KMeans(
__global int* nOutCount,
__global float* vecInPointModel,
__global float* vecInCenterModel

)
{
int i = get_global_id(0);
int flag=0;
float minDistance = 9999999.9;
float dis=0.0;

for (int k = 0; k < 2000; k++)
{
for(int j=0;j<50;j++)
{
float l = fabs(vecInPointModel[i*50+j]- vecInCenterModel[k*50+j]);
dis = dis +l;//dis += l;
}
if (dis <=minDistance )
{
flag = k;
minDistance = dis;
}

dis=0.0;

}
nOutCount[i] = flag;
}
cpu部分代码:
#define N 1000*128 //宏定义
#define CN 2000
#define DIM 50

float* vecInPointModel = new float[N*DIM];//申请内存
float* vecInCenterModel = new float[CN*DIM];
int* nOutCount = new int[N];
//clCreateBuffer
clmemOut_OutU = clCreateBuffer(m_context, CL_MEM_READ_WRITE, sizeof(int)*N, NULL, NULL);
clmemArrayIn_Point = clCreateBuffer(m_context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(float)*N*DIM, vecInPointModel, NULL);
clmemArrayIn_Center = clCreateBuffer(m_context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(float)*CN*DIM, vecInCenterModel, NULL);
int a = 0;

err = clSetKernelArg(m_kernel_Add,a++,sizeof(cl_mem),&clmemOut_OutU);//设置参数
err |= clSetKernelArg(m_kernel_Add,a++,sizeof(cl_mem),&clmemArrayIn_Point);
err |= clSetKernelArg(m_kernel_Add,a++,sizeof(cl_mem),&clmemArrayIn_Center);

size_t localws[1] = {32};
size_t globalws[1] = {N};
int* nOutSumCount = new int[N];
//运行
err = clEnqueueNDRangeKernel(m_commandQueue,m_kernel_Add,1,NULL,globalws,localws,0,NULL,NULL);
clFinish(m_commandQueue);
//读取
err = clEnqueueReadBuffer(m_commandQueue, clmemOut_OutU,CL_TRUE,0,sizeof(int)*N,nOutSumCount,0,0,0);

Interl运行正常 NVIDIA运行clEnqueueReadBuffer报错CL_OUT_OF_RESOURCES
不用担心内存申请过大,Interl GPU才384M NVIDIA是512M
也不用担心globalsize和localsize
也不用担心数组越界

另外通过测试:(只进行参考 避免误导)
for(int j=0;j<50;j++)
{
float l = fabs(vecInPointModel[i*50+j]- vecInCenterModel[k*50+j]);
dis = dis +l;//dis += l;
}
if (dis <=minDistance )
{
flag = k;
minDistance = dis;
}
完全屏蔽if或者for NVIDIA都能正常运行,否则CL_OUT_OF_RESOURCES
屏蔽for里面的dis = dis +l; 也能正常运行
或者把dis = dis +l;改成dis += 1.0; 也能正常运行。为什么跟vecInPointModel[i*50+j]这个联系上,就不行?

网上查找没有能够找出错误,还请大神帮个忙,帮小弟看看


...全文
2028 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
内容概要:本文详细探讨了机组组合优化模型的构建,旨在通过合理安排各类发电机组的启停计划和优化出力分配,实现电力系统在经济性和稳定性上的最佳平衡。文章首先介绍了电力系统的四大主要组件——传统火电机组、风电机组、光伏机组和储能系统的参数及运行特性。接着,围绕最小化系统总运行成本这一目标,设计了优化目标函数,并明确了包括功率平衡约束、机组出力上下限约束、风光发电功率约束、弃风弃光约束、爬坡速率约束、储能系统荷电状态约束、充放电功率约束和充放电互斥约束在内的多项约束条件。最后,文章列出了求解机组组合优化模型所需的关键变量,如传统机组的开停状态、机组出力、启停成本、风电光伏实际出力、弃风弃光比例及储能系统的充放电功率和荷电状态,以实现系统的经济调度和可再生能源的最大化利用。 适合人群:从事电力系统研究、规划和调度工作的工程师和技术人员,以及对电力系统优化感兴趣的科研人员。 使用场景及目标:①帮助电力系统工程师理解不同类型发电机组的特点及其对系统稳定性、经济性和环保性的影响;②为制定合理的电力系统调度策略提供理论依据和技术支持;③促进可再生能源的有效整合,提高电力系统的灵活性和可靠性。 其他说明:本文提供的模型和方法不仅适用于当前的电力系统,也可为未来含高比例可再生能源接入的电力系统提供参考。文中涉及的具体数学公式和参数设定为实际应用提供了详细的指导,有助于提升电力系统的运行效率和经济效益。

608

社区成员

发帖
与我相关
我的任务
社区描述
异构开发技术
社区管理员
  • OpenCL和异构编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧