cuda二维数据极值点计算,每次结果都不相同
社区首页 (3517)




请编写您的帖子内容
社区频道(2)
显示侧栏
卡片版式
全部
Ada助手
最新发布
最新回复
标题
阅读量
内容评分
精选

20
评分
回复


cuda二维数据极值点计算,每次结果都不相同
下面是我的代码,每一次得到的结果都不相同,请大神帮我看看~ __global__ void cuda_findExtrema(float* input, float* extremaX, float* extremaY, float* maxValu
复制链接 扫一扫
分享

160
评分
回复


怎么用c++程序写一个能读取CPU、内存、GPU占用率?
要完整代码,不要代码片段,
怎么用c++程序写一个能读取CPU、内存、GPU占用率? 要完整代码,不要代码片段,
复制链接 扫一扫
分享

164
评分
回复


Linux Shell - Linux Shell小白入门学习教程 - Linux Shell练习 - HPC基础 - 源码设计师
Linux Shell - Linux Shell小白入门学习教程 - Linux Shell练习 - HPC基础 - 源码设计师 Linux Shell小白入门学习教程 - Linux Shell练习 - HPC基础 - 猿码设计师; Linux shell的存在时间比大多数用户的存在时间都要长。它之所以幸存下来,是因为它是一个强大的工具,通常只需几个按键或几行代码,就可以让用户执行复杂而强大的任务。它可以帮助用户自动执行重复性任务,并轻松地将较小的任务组合成更大、更强大的工作流程。使用shell是各种高
复制链接 扫一扫
分享

168
评分
回复


Linux Shell 进阶 - Linux Shell进阶学习教程 - Linux Shell练习 - HPC基础 - 源码设计师
Linux Shell 进阶 - Linux Shell进阶学习教程 - Linux Shell练习 - HPC基础 - 源码设计师 Linux Shell进阶学习教程 - Linux Shell练习 - HPC基础 - 猿码设计师; Linux shell的存在时间比大多数用户的存在时间都要长。它之所以幸存下来,是因为它是一个强大的工具,通常只需几个按键或几行代码,就可以让用户执行复杂而强大的任务。它可以帮助用户自动执行重复性任务,并轻松地将较小的任务组合成更大、更强大的作业流程。https://www.
复制链接 扫一扫
分享

163
评分
回复


如何在 Golang 中构建生产级 REST API - 猿码设计师
如何在 Golang 中构建生产级 REST API - 猿码设计师https://www.yuanmadesign.com/ymdesign/go-router有一种说法是,用 golang 编写的 API 不能像其他语言那样简单和惯用。实际上,我遇到过很多 REST API 代码库,这些代码库复杂混乱,其中包含很多的抽象,最终损害了可读性和可维护性。在这个系列中,我们将介绍如何构建一个生产级的 todo list rest api,它将有机地增长,从代码结构和路由等开始,然后添加一个 mongo db
复制链接 扫一扫
分享

158
评分
回复


Linux Bash 配置揭秘 shell - 猿码设计师
Linux Bash 配置揭秘 shell - 猿码设计师linux shell bash 配置;.bash_profile、.profile 和 .bashrc 约定; Login Shell vs. Non-login Shell;https://www.yuanmadesign.com/ymdesign/linux-shell-bash.bash_profile、.profile 和 .bashrc 约定Linux 和 OS X 上的 Bash 配置可能会让很多人感到困惑,包括我自己。我写了这个简短的
复制链接 扫一扫
分享

174
评分
回复


Linux gdb子进程和多进程调试 - 猿码设计师 follow-fork-mode
Linux gdb子进程和多进程调试 - 猿码设计师 follow-fork-mode默认情况下,父进程fork一个子进程,gdb只会继续调试父进程而不会关心子进程的运行。如果需要在多个子进程和父进程间来回跳跃调试,则需要设置相关参数detach-on-fork。https://www.yuanmadesign.com/ymdesign/gdb-debug-fork默认情况下,父进程fork一个子进程,gdb只会继续调试父进程而不会关心子进程的运行。如果需要在多个子进程和父进程间来回跳跃调试,则需要设置相关
复制链接 扫一扫
分享

212
评分
1


初学HPC平台使用的困惑
请问HPC平台上使用conda环境和提交作业是不是并没有什么关系?环境打不开也可以提交作业运行是吗? (图一为启用环境页面;图二为作业提交页面) 小白求教呜呜,感谢各位!!!
复制链接 扫一扫
分享

224
评分
1


全量账户表和增量交易表关联,如果交易表要重跑前天,此时账户表还是今天的全量,关联出的数据不是前天的跑批状态,这种怎么办,求大神回复!
全量账户表和增量交易表关联,如果交易表要重跑前天,此时账户表还是今天的全量,关联出的数据不是前天的跑批状态,这种怎么办,求大神回复!
复制链接 扫一扫
分享

237
评分
1


请问当下计算密集型任务在CPU集群上进行计算除了MPI还有什么框架推荐呢?
我遇到一个问题,需要计算很多个粒子在流场(7个G左右)中的运行轨迹,单个粒子每迭代一步都需要获取当前位于的网格内信息,然后在根据当前的网格信息进行计算,得到下一步的位置。周而复始。请问一下这个该怎么实现集群上的并行计算?嘤嘤嘤
复制链接 扫一扫
分享

245
评分
回复


召唤一些懂数学和精通C的,计算库方向的。
在读本科,在读研究生,或者毕业两三年的,高等数学功底仍扎实。 数学、计算数学、物理、计算机专业的都行。如果你听过BLAS、FFT、MATH计算库则更佳。 地点:长沙,芯城科技园 导师我已经帮你准备好了,一起来改变世界吧。微信加sz-qvc 张先轶,毕业于北京理工大学,中科院博士,曾在UT Austin和MIT进行博士后研究工作。国际知名开源矩阵计算项目OpenBLAS发起人和主要维护者。中国计算机学会高性能计算专业委员会委员,ACM SIGHPC China执行委员。2016年获得中国计算机学会
复制链接 扫一扫
分享

221
评分
回复


寻找OpenHPC实施方
请各位大神推荐珠三角地区有做OpenHPC实施方的资源。谢谢!
复制链接 扫一扫
分享

313
评分
1


求助,在vscode上初用MSMPI遇到个问题
在vscode上试着调用MPI并行输出,按着Windows系统下在VSCode中配置MPI开发环境来实现。一个最基本的代码可是一直输出不出来,所以求助论坛大佬! hello.cpp的代码如下: #include<iostream> #include "stdint.h" #include "mpi.h" using namespace std; int main(int argc,char * argv[]){ cout<<"1"<<endl; int myid,numprocs; int na
复制链接 扫一扫
分享

319
评分
回复


如何进行类似于cor()操作?
请教一下各位大神,我有一个100*100的矩阵X,想进行类似于cor(X)的操作,但是相关系数是其它的函数,用for循环太慢了!请问应该怎么操作呢?
复制链接 扫一扫
分享

344
评分
1


请教各位大大关于MPI并行计算的问题
如题,最近在利用MPI做并行计算,求解大型稀疏线性方程组,目前遇到了一个问题,就是我的方程组的系数矩阵是通过读取dat文件到程序中,在利用mpiexec 设置多进程来执行程序的时候,每个进程都读取了存储矩阵的dat文件,我现在希望只在主进程读取dat文件,不知道该怎么实现,我的代码是用fortran语言编写的,求各位大大指导,感激不尽!!
复制链接 扫一扫
分享

314
评分
回复


MATLAB怎样求解由简单方程和微分方程组成的方程组?
ode45可以求解既有一般方程(如x^2+y^2+5=8)又有微分方程(如dy/dt+dx/dt=5)组成的方程组吗?
复制链接 扫一扫
分享

329
评分
回复


了解impala的大佬进来看下
有没有大佬了解以下情况:有一个集群8台服务器,每台机器的内存128g,都装了impalad和datanode,impala客户端在发送一条复杂的sql给节点1,sql里面用到的表是很大的。运算sql的时候看了一下每台机器的内存使用,发现并不是所有的机器都把内存使用上了,只是其中3台机器内存飙升,快要爆掉,其他的几台好像都没动静,照理来说,集群不是应该会有负载均衡的策略吗,想了解一下是什么情况,我个人认为会不会是数据文件只是在这三台服务器存储,那如何在写数据的时候数据文件均衡分布?
复制链接 扫一扫
分享

349
评分
回复


mpi多机并行时报错,怎么办?
报错信息如下: 我用的MS-MPI,程序单机运行时完全没有问题,但是多机运行时就不行了。 报错信息说的是MS-MPI版本问题,但是我单机运行时明明没问题啊,就必须降到低版本吗?
复制链接 扫一扫
分享

432
评分
回复


Linpack性能和内存是否相关。
最近在看关于CPU linpack的博客,在网上看来很多关于Linpack HPC的博客,其中对内存好像要求并不严格,基本都是说内存越大越好,并且参数是跟着内存走的。 考虑了如下场景,在CPU参数,硬盘参数保持一致下,NUMA架构双CPU ,128G内存的跑分理论上来说是不是应该是单CPU,64G内存跑出来分的两倍呢。
复制链接 扫一扫
分享
为您搜索到以下结果: