社区
英特尔边缘计算技术
帖子详情
一个利用Openmp优化程序的问题
lishengjie
2010-10-09 09:59:59
我用openmp写了一个例程,比较优化前后的性能。
核心算法是一个4x4的矩阵乘法,调用2000000次。
我使用
#pragma omp parallel for
for(int i = 0;i<2000000;++i)
DoTest();
发现openmp消耗的时间比,普通的串行多很多。
使用vs2008 sp1
有高手给点建议么?
...全文
133
3
打赏
收藏
一个利用Openmp优化程序的问题
我用openmp写了一个例程,比较优化前后的性能。 核心算法是一个4x4的矩阵乘法,调用2000000次。 我使用 #pragma omp parallel for for(int i = 0;i<2000000;++i) DoTest(); 发现openmp消耗的时间比,普通的串行多很多。 使用vs2008 sp1 有高手给点建议么?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lishengjie
2010-10-11
打赏
举报
回复
解决部分问题,至少现在并行比串行快,但还没看到能快2倍。子函数里事情做多了,只保留计算部分即可。
shayla
2010-10-09
打赏
举报
回复
1:不知道你的机器是不是多核的.
2:可以打出线程ID看是否有多个线程在执行
lishengjie
2010-10-09
打赏
举报
回复
双核,两个线程在跑。我感觉可能是4x4的矩阵乘法的运算量不大,消耗在线程上的开销比真实运算大。
但问题是,大量的小任务计算,如何通过并行来加速呢?
OPENMP
优化
实例
###
OPENMP
优化
实例 #### 一、概述 本案例研究主要介绍了如何
利用
OpenMP
进行代码
优化
,特别是针对多核处理器的并行计算环境。通过具体的示例,包括虚假共享(False Sharing)、块矩阵更新(Block Matrix Update)以及...
MPI
OpenMP
混合编程解决N-Body
问题
N-Body
问题
是
一个
典型的物理模拟
问题
,用于研究多个质点在相互引力作用下的运动状态。在天文学中,它可以用来模拟星系的演化;在分子动力学中,它可以模拟大量分子的相互作用。由于
问题
的复杂性,随着N的增大,计算...
利用
OpenMP
/CUDA/MPI对FFT算法
优化
程序
课程报告
FFT算法主要是将原始
问题
分解为两个规模较小的子
问题
来解决,这一策略满足了分治法的思想。具体地,当序列长度为2的幂时,可以通过以下公式计算FFT: Y[i] = (n/2) - 1 Σ X[2k] * ω^(ki) + ω^i * X[2k+1] * ω^...
MPI与
OpenMP
并行
程序
设计:C语言版,mpi和
openmp
混合编程,C,C++
当我们需要在
一个
系统上同时
利用
分布式内存和共享内存的优点时,就会涉及到MPI与
OpenMP
的混合编程。通常,MPI用于处理跨节点的通信,而
OpenMP
则负责同一节点内的多线程并行。例如,可以使用MPI启动多个进程,每个...
利用
OpenMP
线程绑定技术提升多核平台应用性能
###
利用
OpenMP
线程绑定技术提升多核平台应用性能 #### 摘要 随着多核处理器的普及,如何高效地
利用
这些处理器成为了
一个
重要的研究课题。特别是在多核平台上,线程在不同核心之间的动态迁移可能会导致应用
程序
...
英特尔边缘计算技术
567
社区成员
7,024
社区内容
发帖
与我相关
我的任务
英特尔边缘计算技术
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
复制链接
扫一扫
分享
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章