MapReduce VS Parallel DBMS 的文章下载

weixin_39821051 2019-09-13 10:30:19
...全文
15 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
37篇经过消化云计算论文打包下载 [日期:2010-02-20] 来源:中国云计算 作者:龚传 [字体:大 中 小] 下列论文归类: 1、云计算设施管理 监测 2,34 负载均衡 33,35 数据管理 32 能耗管理 29 安全管理 25 2、云计算平台实例 虚拟机 27,31 存储平台 5,6,12,13,14,19,22,26 计算平台 平台测评 1 云平台集成 10 3、云计算理论模型 描述模型 4 选择模型 20 编程模型 7,9,18,24,36 4、云计算应用研究 商业应用 科学应用 11,15,17,23 云安全 21,30 这37篇论文系刘鹏教授的研究生龚传消化整理,欢迎下载! 1、 Atmosphere-Ocean Climate (性能测试) 这篇文章讨论了高性能标准测试应用程序在亚马逊EC2云计算系统中的性能。经过测试发现EC2云计算系统是一个可靠的解决方案,支持按需响应,小规模,高性能计算应用程序。 2、 Chukwa: A large-scale monitoring system Chukwa是建立在Hadoop上的数据收集系统,用以监控和分析大规模的分布式系统。本文介绍了他的设计和初步实施。 3、 Cloud Computing and Grid Computing 360-Degree Compared Ian Foster比较对比了云计算和网格计算的各方面,并给出了两者的本质特征。 4、 Toward a Unified Ontology of Cloud Computing 这篇文章把云模型分为5层,解释了他们的内在关系,本文的贡献是第一个对云模型建立本体。 5、 The Cumulus Project: Build a Scientific Cloud for a Data Center 介绍了Cumulus工程的各个方面,如实验床,基础设施,中间件和应用程序模型。 6、 The Eucalyptus Open-source Cloud-computing System Eucalyptus作为云计算开源的软件框架,概述了他设计的基本原则,简单易于使用而且能模块化。 7、 GridBatch: Cloud Computing for Large-Scale Data-Intensive Batch Applications GridBatch系统为解决在云计算下的大规模精密数据批处理问题,GridBatch是一个编程模型,用户能控制数据的分割,控制计算怎么被分布的,最后给出一个例子,展示了他在EC2下的高性能。 8、 Cost-Benefit Analysis of Cloud Computing versus Desktop Grids 分析对比了采用云计算模型和桌面电脑组成的网格模型在性能和成本收益方面的优劣。 9、 Programming Abstractions for Clouds 本文讨论了云应用程序编程面临的挑战与发展,通过几个应用程序的讨论,演示了可能的解决方案。同时讨论了怎样正确使用抽象的编程接口,框架使其更有效,可扩展,最重要的独立于系统,这些接口框架支持普通的编程执行模式。 10、 The RESERVOIR Model and Architecture for Open Federated Cloud Computing 本文提出了RESERVOIR工程,他是一个体系结构,他允许云基础设施的提供者动态的和其他云设施成为伙伴,从而构成一个无限的信息资源池,同时不同的云设施保证他自己技术和商业管理决定高度自治。 11、 Science Clouds: Early Experiences in Cloud Computing for Scientific Applications 这篇文档包含科学项目采用科学云技术的描述,还有他经验的早期总结。 12、 Sector and Sphere: The Design and Implementation of a High Performance Data Cloud 在这篇论文中,我们介绍了一个新的云计算软件,他包括Sector存储云和Sphere计算云。对比现有的数据云,Sector不但支持作为数据中心的数据存储,而且可以在广域网上进行数据分发。Sphere执行流处理示例,从而支持数据密集型的应用。Sphere支持所有能用MapReduce完成的应用,Sphere更简单更容易使用。根据我们的实验研究他的速度是Hadoop的两倍。 13、 Phoenix Cloud: Consolidating Different Computing Loads on Shared Cluster System for Large Organization 在论文中,我们设计运行了software-phoenix云管理系统,在共享的集群系统中整合异构的计算负载。进一步,我们还提出了供大组织和他附属部门共享集群系统的合作资源提供和管理策略。Phoenix Cloud减少了系统的规模。 14、 Adapting MapReduce for Dynamic Environments Using a Peer-to-Peer Model 本文作者描述基于P2P的MapReduce的体系结构,概述了在JXTA框架下的运行情况。 15、 Parallelizing bioinformatics applications with MapReduce 本文讲了采用mapreduce技术来完成并行的生物分析的一个应用。本文的这个应用是在Hadoop下完成的,讲了两个算法,一个用于支持大规模数据集的流计算,一个用于计算小数据集的策略。 16、 Do Clouds Compute? A Framework for Estimating the Value of Cloud Computing 在这篇论文中,我们讨论了云计算中的核心组件,以及在框架中构建组件,这个框架能帮助决策者评估云计算的成本,对比传统解决方案和云计算方案在成本上的差异。 17、 Using Transaction Based Parallel Computing to Solve Image Processing and Computational Physics Problems 本文讲了在Hadoop下用并行计算来解决图像处理和计算物理学的问题。 18、 All-Pairs: An Abstraction for Data-Intensive Cloud Computing 本文提出形成产品的系统应该为终端用户提供高度抽象的使用方法,以便容易表达,对于精密数据的工作量能高效的执行。文中提出了一个抽象的例子,all-pairs,他满足精密数据科学应用的需要。 19、 Seattle: A Platform for Educational Cloud Computing 本文介绍了用于教育界的云计算平台。讲了他的体系,部署,对于学生和教师的使用概况。 20、 Cloud Cube Model: Selecting Cloud Formations for Secure Collaboration 本文解释了不同云的构成,详述了每种云构成的特征,优势和风险。 21、 CloudAV: N-Version Antivirus in the Network Cloud 本文提出了一种在终端主机上检测恶意病毒的新模型。这种检测是基于提供防病毒软件作为一个云网络服务。我们构建配置了云防病毒系统,CloudAV,他包括轻量级跨平台的主机代理,一个由十个防病毒软件引擎构成的网络服务,和两个检测引擎。经过测试有很好的性能。 22、 Implementation Issues of A Cloud Computing Platform 本文在对GFS研究的基础上,设计出可变块大小的兼容文件系统,以便大数据的处理。同时介绍了对MapReduce的改进以增加系统的吞吐量。 23、 Scalable Semantics – the Silver Lining of Cloud Computing 本文提出在云计算模型下快速的进行分布式RDF的查询和推理。 24、 On the Use of Cloud Computing for Scientific Workflows 本文提出在科学工作流中使用云计算,经过测试比较,对于作业运行时间短的工作流,虚拟的环境能有好的计算时间性能,但同时也有资源调度延迟的缺点。 25、 Taking Account of Privacy when Designing Cloud Computing Services 本文讨论了云计算中面临的机密性的问题,提出了解决机密性问题的关键设计原则。 26、 Cloud Computing for e-Science with CARMEN CARMEN供神经学家共享,整合,分析数据的一个系统,本文概述了这个系统。该系统在云计算这个模型下。 27、 An Evaluation of KVM for Use in Cloud Computing 本文描述了一个基于内核虚拟机的虚拟集群,以取代VMware和Xen。本文提出了虚拟组织集群模型技术,他显示了云计算强大的潜能。 28、 A Tale of Clouds: Paradigm Comparisons and Some Thoughts on Research Issues 本文定性的比较了云计算,服务计算,普适计算各方面的特点。 29、 Energy Aware Consolidation for Cloud Computing 本文讨论了云计算中的能量问题,为了使能量有效的整合,我们要研究能量消耗,资源利用,整合后的工作量的性能之间的内在关系,研究揭露了能量性能的权衡与整合,证明存在最佳的工作点,我们模拟了整合的问题,并用一个例子进行了解释。 30、 Toward Automatic Discovery of Malware Signature for Anti-virus Cloud Computing 防病毒安全产品由于他们有大量签名的文件,消耗了大量PC内存和资源,防病毒云计算模型变成流行的解决方案。本文提出了AMSDS在防病毒云下的自动恶意病毒签名发现系统,经测试有很好的性能。 31、 SnowFlock: Rapid Virtual Machine Cloning for Cloud Computing 克隆虚拟机 虚拟机fork是一个新的云计算抽象,他能快速的克隆虚拟机成很多副本运行在不同的主机上。本文提出了SnowFlock项目,他是虚拟机fork的一个实现。文中讲了他的设计原理和实现机制,并对性能进行了测试分析。 32、 Data Management in the Cloud: Limitations and Opportunities 本文讨论了在云计算平台下数据管理的限制与优势。列出了在亚马逊平台下为大型数据分析而设计的DBMS应包含的一些特征。本文还表达了在云计算环境下对新的DBMS的需要。 33、 Cloud Control with Distributed Rate Limiting 这篇文章提出了分布式等级限制器的设计与实现,他能够调整基于云服务的网络通信的策略。这种抽象与设计不但执行全局的限制,同时他确保传输层的响应拥塞流表现得像被单一共享的限制器所控制。这种设计能允许服务的执行者明确的在通信代价和系统效率可靠性之间做出权衡。同时他们证明他们基于中心TCP的设计可在许多节点进行升级,减少系统的通信延迟和损耗。 34、 Computer Meteorology: Monitoring Compute Clouds 云计算环境允许用户在云供应商的硬件上执行任意的代码,云用户面临很多安全的挑战,恶意用户可以利用供应商的硬件发动攻击,这种攻击能破坏供应商的信誉,同时影响他服务于其他客户的能力。我们表明,尽管云供应商可以利用内部机制,检测用户虚拟机恶意行为,必须小心使用,因为现有的内部技术是基于假设并不拥有在云环境中。 35、 Optimizing Utility in Cloud Computing through Autonomic Workload Execution 36、 LINQ-to-DataCenter 37、 Cloud Computing & Databases How databases can meet the demands of cloud computing
37篇经过消化的云计算论文 下列论文归类: 1、云计算设施管理 监测 2,34 负载均衡 33,35 数据管理 32 能耗管理 29 安全管理 25 2、云计算平台实例 虚拟机 27,31 存储平台 5,6,12,13,14,19,22,26 计算平台 平台测评 1 云平台集成 10 3、云计算理论模型 描述模型 4 选择模型 20 编程模型 7,9,18,24,36 4、云计算应用研究 商业应用 科学应用 11,15,17,23 云安全 21,30 1、 Atmosphere-Ocean Climate (性能测试) 这篇文章讨论了高性能标准测试应用程序在亚马逊EC2云计算系统中的性能。经过测试发现EC2云计算系统是一个可靠的解决方案,支持按需响应,小规模,高性能计算应用程序。 2、 Chukwa: A large-scale monitoring system Chukwa是建立在Hadoop上的数据收集系统,用以监控和分析大规模的分布式系统。本文介绍了他的设计和初步实施。 3、 Cloud Computing and Grid Computing 360-Degree Compared Ian Foster比较对比了云计算和网格计算的各方面,并给出了两者的本质特征。 4、 Toward a Unified Ontology of Cloud Computing 这篇文章把云模型分为5层,解释了他们的内在关系,本文的贡献是第一个对云模型建立本体。 5、 The Cumulus Project: Build a Scientific Cloud for a Data Center 介绍了Cumulus工程的各个方面,如实验床,基础设施,中间件和应用程序模型。 6、 The Eucalyptus Open-source Cloud-computing System Eucalyptus作为云计算开源的软件框架,概述了他设计的基本原则,简单易于使用而且能模块化。 7、 GridBatch: Cloud Computing for Large-Scale Data-Intensive Batch Applications GridBatch系统为解决在云计算下的大规模精密数据批处理问题,GridBatch是一个编程模型,用户能控制数据的分割,控制计算怎么被分布的,最后给出一个例子,展示了他在EC2下的高性能。 8、 Cost-Benefit Analysis of Cloud Computing versus Desktop Grids 分析对比了采用云计算模型和桌面电脑组成的网格模型在性能和成本收益方面的优劣。 9、 Programming Abstractions for Clouds 本文讨论了云应用程序编程面临的挑战与发展,通过几个应用程序的讨论,演示了可能的解决方案。同时讨论了怎样正确使用抽象的编程接口,框架使其更有效,可扩展,最重要的独立于系统,这些接口框架支持普通的编程执行模式。 10、 The RESERVOIR Model and Architecture for Open Federated Cloud Computing 本文提出了RESERVOIR工程,他是一个体系结构,他允许云基础设施的提供者动态的和其他云设施成为伙伴,从而构成一个无限的信息资源池,同时不同的云设施保证他自己技术和商业管理决定高度自治。 11、 Science Clouds: Early Experiences in Cloud Computing for Scientific Applications 这篇文档包含科学项目采用科学云技术的描述,还有他经验的早期总结。 12、 Sector and Sphere: The Design and Implementation of a High Performance Data Cloud 在这篇论文中,我们介绍了一个新的云计算软件,他包括Sector存储云和Sphere计算云。对比现有的数据云,Sector不但支持作为数据中心的数据存储,而且可以在广域网上进行数据分发。Sphere执行流处理示例,从而支持数据密集型的应用。Sphere支持所有能用MapReduce完成的应用,Sphere更简单更容易使用。根据我们的实验研究他的速度是Hadoop的两倍。 13、 Phoenix Cloud: Consolidating Different Computing Loads on Shared Cluster System for Large Organization 在论文中,我们设计运行了software-phoenix云管理系统,在共享的集群系统中整合异构的计算负载。进一步,我们还提出了供大组织和他附属部门共享集群系统的合作资源提供和管理策略。Phoenix Cloud减少了系统的规模。 14、 Adapting MapReduce for Dynamic Environments Using a Peer-to-Peer Model 本文作者描述基于P2P的MapReduce的体系结构,概述了在JXTA框架下的运行情况。 15、 Parallelizing bioinformatics applications with MapReduce 本文讲了采用mapreduce技术来完成并行的生物分析的一个应用。本文的这个应用是在Hadoop下完成的,讲了两个算法,一个用于支持大规模数据集的流计算,一个用于计算小数据集的策略。 16、 Do Clouds Compute? A Framework for Estimating the Value of Cloud Computing 在这篇论文中,我们讨论了云计算中的核心组件,以及在框架中构建组件,这个框架能帮助决策者评估云计算的成本,对比传统解决方案和云计算方案在成本上的差异。 17、 Using Transaction Based Parallel Computing to Solve Image Processing and Computational Physics Problems 本文讲了在Hadoop下用并行计算来解决图像处理和计算物理学的问题。 18、 All-Pairs: An Abstraction for Data-Intensive Cloud Computing 本文提出形成产品的系统应该为终端用户提供高度抽象的使用方法,以便容易表达,对于精密数据的工作量能高效的执行。文中提出了一个抽象的例子,all-pairs,他满足精密数据科学应用的需要。 19、 Seattle: A Platform for Educational Cloud Computing 本文介绍了用于教育界的云计算平台。讲了他的体系,部署,对于学生和教师的使用概况。 20、 Cloud Cube Model: Selecting Cloud Formations for Secure Collaboration 本文解释了不同云的构成,详述了每种云构成的特征,优势和风险。 21、 CloudAV: N-Version Antivirus in the Network Cloud 本文提出了一种在终端主机上检测恶意病毒的新模型。这种检测是基于提供防病毒软件作为一个云网络服务。我们构建配置了云防病毒系统,CloudAV,他包括轻量级跨平台的主机代理,一个由十个防病毒软件引擎构成的网络服务,和两个检测引擎。经过测试有很好的性能。 22、 Implementation Issues of A Cloud Computing Platform 本文在对GFS研究的基础上,设计出可变块大小的兼容文件系统,以便大数据的处理。同时介绍了对MapReduce的改进以增加系统的吞吐量。 23、 Scalable Semantics – the Silver Lining of Cloud Computing 本文提出在云计算模型下快速的进行分布式RDF的查询和推理。 24、 On the Use of Cloud Computing for Scientific Workflows 本文提出在科学工作流中使用云计算,经过测试比较,对于作业运行时间短的工作流,虚拟的环境能有好的计算时间性能,但同时也有资源调度延迟的缺点。 25、 Taking Account of Privacy when Designing Cloud Computing Services 本文讨论了云计算中面临的机密性的问题,提出了解决机密性问题的关键设计原则。 26、 Cloud Computing for e-Science with CARMEN CARMEN供神经学家共享,整合,分析数据的一个系统,本文概述了这个系统。该系统在云计算这个模型下。 27、 An Evaluation of KVM for Use in Cloud Computing 本文描述了一个基于内核虚拟机的虚拟集群,以取代VMware和Xen。本文提出了虚拟组织集群模型技术,他显示了云计算强大的潜能。 28、 A Tale of Clouds: Paradigm Comparisons and Some Thoughts on Research Issues 本文定性的比较了云计算,服务计算,普适计算各方面的特点。 29、 Energy Aware Consolidation for Cloud Computing 本文讨论了云计算中的能量问题,为了使能量有效的整合,我们要研究能量消耗,资源利用,整合后的工作量的性能之间的内在关系,研究揭露了能量性能的权衡与整合,证明存在最佳的工作点,我们模拟了整合的问题,并用一个例子进行了解释。 30、 Toward Automatic Discovery of Malware Signature for Anti-virus Cloud Computing 防病毒安全产品由于他们有大量签名的文件,消耗了大量PC内存和资源,防病毒云计算模型变成流行的解决方案。本文提出了AMSDS在防病毒云下的自动恶意病毒签名发现系统,经测试有很好的性能。 31、 SnowFlock: Rapid Virtual Machine Cloning for Cloud Computing 克隆虚拟机 虚拟机fork是一个新的云计算抽象,他能快速的克隆虚拟机成很多副本运行在不同的主机上。本文提出了SnowFlock项目,他是虚拟机fork的一个实现。文中讲了他的设计原理和实现机制,并对性能进行了测试分析。 32、 Data Management in the Cloud: Limitations and Opportunities 本文讨论了在云计算平台下数据管理的限制与优势。列出了在亚马逊平台下为大型数据分析而设计的DBMS应包含的一些特征。本文还表达了在云计算环境下对新的DBMS的需要。 33、 Cloud Control with Distributed Rate Limiting 这篇文章提出了分布式等级限制器的设计与实现,他能够调整基于云服务的网络通信的策略。这种抽象与设计不但执行全局的限制,同时他确保传输层的响应拥塞流表现得像被单一共享的限制器所控制。这种设计能允许服务的执行者明确的在通信代价和系统效率可靠性之间做出权衡。同时他们证明他们基于中心TCP的设计可在许多节点进行升级,减少系统的通信延迟和损耗。 34、 Computer Meteorology: Monitoring Compute Clouds 云计算环境允许用户在云供应商的硬件上执行任意的代码,云用户面临很多安全的挑战,恶意用户可以利用供应商的硬件发动攻击,这种攻击能破坏供应商的信誉,同时影响他服务于其他客户的能力。我们表明,尽管云供应商可以利用内部机制,检测用户虚拟机恶意行为,必须小心使用,因为现有的内部技术是基于假设并不拥有在云环境中。 35、 Optimizing Utility in Cloud Computing through Autonomic Workload Execution 36、 LINQ-to-DataCenter 37、 Cloud Computing & Databases How databases can meet the demands of cloud computing
以前和大家分享过SIGMOD2009的论文,朋友们都很感兴趣,现手里有SIGMOD211的全部论文,再次和大家分享~ 一个包放不下,一共分成了3个包,包含百余篇论文,朋友们可以挑选自己感兴趣的部分下载,我尽量把文章目录写得明白一些。 这是第二部分。 Nearest Keyword Search in XML Documents (Page 589) Yufei Tao (Chinese University of Hong Kong) Stavros Papadopoulos (Chinese University of Hong Kong) Cheng Sheng (Chinese University of Hong Kong) Kostas Stefanidis (Chinese University of Hong Kong) Efficient and Generic Evaluation of Ranked Queries (Page 601) Wen Jin (Independent Consultant) Jignesh M. Patel (University of Wisconsin - Madison) (Return to Top) Session 13: Stream and Complex Event Processing Changing Flights in Mid-Air: A Model for Safely Modifying Continuous Queries (Page 613) Kyumars Sheykh Esmaili (ETH Zurich) Tahmineh Sanamrad (ETH Zurich) Peter M. Fischer (ETH Zurich) Nesime Tatbul (ETH Zurich) How Soccer Players Would Do Stream Joins (Page 625) Jens Teubner (ETH Zurich) Rene Mueller (IBM Almaden Research Group) BE-Tree: An Index Structure to Efficiently Match Boolean Expressions Over High-Dimensional Discrete Space (Page 637) Mohammad Sadoghi (University of Toronto) Hans-Arno Jacobsen (University of Toronto) TI: An Efficient Indexing Mechanism for Real-Time Search on Tweets (Page 649) Chun Chen (Zhejiang University) Feng Li (National University of Singapore) Beng Chin Ooi (National University of Singapore) Sai Wu (National University of Singapore) (Return to Top) Session 14: Query Processing More Efficient Datalog Queries: Subsumptive Tabling Beats Magic Sets (Page 661) K. Tuncay Tekle (LogicBlox, Inc.) Yanhong A. Liu (State University of New York at Stony Brook) Entangled Queries: Enabling Declarative Data-Driven Coordination (Page 673) Nitin Gupta (Cornell University) Lucja Kot (Cornell University) Sudip Roy (Cornell University) Gabriel Bender (Cornell University) Johannes Gehrke (Cornell University) Christoph Koch (École Polytechnique Fédérale de Lausanne) Data Generation Using Declarative Constraints (Page 685) Arvind Arasu (Microsoft Research) Raghav

12,807

社区成员

发帖
与我相关
我的任务
社区描述
CSDN 下载资源悬赏专区
其他 技术论坛(原bbs)
社区管理员
  • 下载资源悬赏专区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧