kernel launch请教
我想用GPU进行电路仿真,目前遇到kernel的划分问题想请教大家。
如果电路已经被分为n层,在进行GPU计算的时候,是选择对于每一层电路Launch一次kernel,还是只Launch一次Kernel,在这个kernel中计算整个电路结构?
如果采用每层Launch一次的话,这样不断开启kernel开销会不会很大啊?而且每一次在launch kernel的同时还要再进行数据拷贝。如果只launch一次的话,就要传输大量数据,而且在控制上也不是很方便,比如何时读出计算结果。
谢谢!