社区
下载资源悬赏专区
帖子详情
基于神威众核处理器的排列熵算法并行加速方法.pdf下载
weixin_39821746
2021-10-19 10:17:01
基于神威众核处理器的排列熵算法并行加速方法.pdf , 相关下载链接:
https://download.csdn.net/download/jiebing2020/24610612?utm_source=bbsseo
...全文
12
回复
打赏
收藏
基于神威众核处理器的排列熵算法并行加速方法.pdf下载
基于神威众核处理器的排列熵算法并行加速方法.pdf , 相关下载链接:https://download.csdn.net/download/jiebing2020/24610612?utm_source=bbsseo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
基于
神威
众核
处理器
的
排列熵
算法
并行
加速
方法
.
pdf
基于
神威
众核
处理器
的
排列熵
算法
并行
加速
方法
.
pdf
基于
神威
众核
处理器
的
排列熵
算法
并行
加速
方法
随着嵌入维数的增大,
排列熵
(permutation entropy,PE)
算法
的运算规模将会成倍增加,对计算的时效性提出了更高的要求。针对国际上首台计算性能超过100P的
神威
·太湖之光异构
众核
超级计算机,提出一种针对
排列熵
算法
移植和
并行
化
方法
,核组之间基于MPI对相空间矩阵进行数据划分,核组内部基于OpenACC实现划分区域内部
并行
;然后针对SW26010
众核
处理器
结构特征,调整减少主从核通信次数和消除原子操作,将
排列熵
算法
成功移植并
加速
;最后通过大坝振荡数据进行测试。测试结果表明,该
方法
能够很好地发挥SW26010
众核
处理器
加速
优势,单核组性能较主核版本最高可获得7.18倍
加速
,同时在
神威
·太湖之光大规模集群上进行强可扩展性分析,128核组时最高实现了85.6倍的性能提升。
论文研究-申威
众核
处理器
的
并行
NSGA-II
算法
.
pdf
非支配排序遗传
算法
(NSGA-II)在多目标优化领域有着广泛的应用,但在处理复杂问题时运行时间相当长。
并行
化是提高
算法
执行速度的有效途径。
众核
处理器
的出现,为实现高度
并行
奠定了物质基础。基于国产超算“
神威
·太湖之光”的申威
众核
处理器
平台设计了
并行
NSGA-II
算法
(PNSGA-II),实现了
算法
基于主核的一级
并行
和基于主/从核的二级
并行
。在典型测试函数集上的实验表明,在不影响解的质量前提下,PNSGA-II
算法
不仅大大加快了执行速度,同时
算法
的收敛速度也更快。
面向
神威
·太湖之光的国产异构
众核
处理器
OpenCL编译系统.
pdf
面向
神威
·太湖之光的国产异构
众核
处理器
OpenCL编译系统.
pdf
基于申威
众核
处理器
的NSGA-Ⅱ
并行
和优化
方法
由申威
众核
处理器
组成的“
神威
·太湖之光”是我国当前性能最高的超级计算机,可为大规模NSGA-Ⅱ求解提供硬件平台。基于硬件架构特点,设计了分岛/主从增强混合
并行
NSGA-Ⅱ。在主从模式基础上,利用从核间寄存器通信,实现核组内从核局部数据存储的共享。优化流程,实现更多
算法
模块在从核上的
并行
。运用DMA传输、向量化、双缓冲、存储优化等
方法
显著提高
加速
比。实验表明,优化的
并行
NSGA-Ⅱ在申威
众核
处理器
上具有良好的
加速
比和扩展性。
下载资源悬赏专区
12,446
社区成员
11,904,759
社区内容
发帖
与我相关
我的任务
下载资源悬赏专区
CSDN 下载资源悬赏专区
复制链接
扫一扫
分享
社区描述
CSDN 下载资源悬赏专区
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章