关于内存的东西Copy到显存的问题

senlinshouhu 2014-05-21 04:20:24
oepncl编程时,把内存的东西Copy到显存的时候,速度怎么样啊?比如,我运算完了,想把一个数组. 2048*2048 的int 拷贝到内存.大概多花多长时间比较合理啊?我的怎么感觉这么慢啊?
...全文
702 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
outstander 2014-05-26
  • 打赏
  • 举报
回复
如果算法允许的话,可以试试异步传输。在传输数据的同时进行其他不相关的计算,掩盖掉传输时间。
lcwyylcwyy 2014-05-23
  • 打赏
  • 举报
回复
这个似乎和PCIE的带宽及显卡的memcpy to/from引擎有关,还有和是不是使用的锁页内存和零拷贝技术相关。
SRich 2014-05-22
  • 打赏
  • 举报
回复
22毫秒。。。。。
fronteer 2014-05-22
  • 打赏
  • 举报
回复
平均 800M/second 不到,也不算太差. 其中很多时间是花在为用户 Host Memory 分配并locking 物理页上, 你可以先用操作系统的 mlock() API 先将用户的 Host Memory 锁定再调用 clEnqueueReadBuffer(), 测量一下调用的时间.
fronteer 2014-05-21
  • 打赏
  • 举报
回复
测试一下 clEnqueueWriteBuffer() 操作的性能. 16M bytes 的数据,你具体花的时间是多少?

603

社区成员

发帖
与我相关
我的任务
社区描述
异构开发技术
社区管理员
  • OpenCL和异构编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧