一个关于如何消除数据依赖性的难题

帅气的小王子 2015-04-13 11:41:50

		for (k = 0; k < max; k++)

			A[B[k]] *= C[k];

这段代码中A数组是一段包含m个元素的数组，B数组是一段包含max(max远大于m)个元素的数组，C同样是一段包含max个元素的数组。且B数组中所有元素的值都取在0-m之间。
因为这段代码包含着数据依赖性问题，所以不能直接在CUDA上并行，否则取值会有冲突与覆盖的情况。
由于需要用CUDA并行优化某个程序，类似这样的代码卡在其中，使得并行化受阻，目前只能通过将这段代码转移到CPU执行，执行完后再将结果转回GPU，由于来回传输数据，所以影响了性能。
那么问题来了，可以用什么方式让这段代码实现并行化，希望大家能给小生一些提示与帮助，在下不胜感激！

...全文

417 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

帅气的小王子 2015-04-23

打赏
举报

回复

引用 2 楼 ypz_2006 的回复:

不需要用文件吧，每次直接在内存里排序就行了。thrust里的sort_by_key（）就行。然后用segmented_reduction把C数组乘一下，产生m个输出。最后把A数组和刚才的输出两两相乘。

十分感谢贵君的提点，小弟目前还没有thrust基础，关于您说的sort_by_key（）和segmented_reduction我还没有一个具体的了解，但想必是一个比我这种土办法更优秀的解决方案，我会在以后尝试贵君提供的办法。

ypz_2006 2015-04-23

打赏
举报

回复

不需要用文件吧，每次直接在内存里排序就行了。thrust里的sort_by_key（）就行。然后用segmented_reduction把C数组乘一下，产生m个输出。最后把A数组和刚才的输出两两相乘。

帅气的小王子 2015-04-21

打赏
举报

回复

终于找到解决办法，我自己来结贴。关于这个问题，我试过很多想法，最终决定的策略是以空间换时间，即把B数组的讯息先提取特征，按照从0-m排序，存入一个文件，以后每次运行这个程序，就从文件读取这个特征，当特征分布有序以后，对0-m这些数据并行，那样就不会存在数据冲突问题啦。

前言分布式数据库的数据一致性管理是其最重要的内核技术之一，也是保证分布式数据库满足数据库最基本的ACID特性中的 “一致性”(Consistency)的保障。在分布式技术发展下，数据一致性的解决方法和技术也在不断的演进，本文就以分布式数据库作为案例，介绍分布式数据库数据一致性的原理以及实际实现。 1、数据一致性 1.1 数据一致性是什么大部份使用传统关系型数据库的DBA在看到“数据一致性”时，...

在机器学习过程中，我们往往需要对数据进行预处理。根据数据的取值情况，我们可以把数据总体分为两大类：类别型数据和数值型数据。对于数值性变量，通常不需要对其进行编码处理。而如何处理类别型数据是一个难题。处理的方法有很多种，各有优缺并且各有适用的范围。本文在收集相关资料后，试图对目前较为常见的处理方式做一个归纳总结。 1. 为什么需要编码机器学习相关算法对各数据进行衡量时，依赖...

数据采集系统（Data Collection System）用于从各种异构的数据源中收集信息并将其转换成可以进行分析处理的信息，主要目的就是将原始数据进行整合、清洗、转换、存储等处理过程，产生数据模型（Data Model）。目前很多公司都有数据采集系统，例如新浪微博、百度搜索、京东物流、淘宝订单等。但由于数据采集系统本身很复杂，涉及许多知识点，如数据清洗、数据转换、数据分析、数据可视化等，因此对于初学者来说，搭建和部署一个可靠的数据采集系统是一个难题。

前言 2010年左右，还是在上学的时候，学过一门课程叫《数据仓库与数据挖掘》，那还是属于传统数据的时代，我们会讨论什么是数据仓库？什么是数据集市？数据仓库和数据库有什么区别？等等，当我还在苦苦学习这些之时，大数据时代悄然到来，并迅速改变着各行各业。如今，十年风云际会，大数据早已成了行业绕不开的话题，这其中我们或多或少会接触到很多新兴的概念，例如数据湖、数据中台等，通过一些碎片化的学习，也是大概知...

　　今的数据具有多种多样的形式，而且来自许多不同的数据源。更为重要的是，除非有需要的那些人易于获得大数据，除非能迅速获得洞察力，否则大数据分析工具的用处并不是很大。那么大数据分析将遇到哪些困难? 　　1、解决方案无法提供新见解或及时的见解　　(1)数据不足　　有些组织可能由于分析数据不足，无法生成新的见解。在这种情况下，可以进行数据审核，并确保现有数据集成提供所需的见解。新数据源的集成也可以消除数据的缺乏。还需要检查原始数据是如何进入系统的，并确保所有可能的维度和指标均已经公开并进行分析。最后，数

581

社区成员

2,919

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章