spark源码阅读环境搭建问题

qq_27060875 2018-01-11 12:07:52

各地大侠，现有个问题
我在spark目录下运行sbt命令，下载完依赖包后，再运行eclipse，构建工程。
然后将spark源友作为 maven工程导入到eclipse里面。
但是，sbt下载的依赖包都在.ivy文件夹里面，maven工程依赖包在.m2文件夹里面。
so 1：那么，此时，我在eclipse里面编译，是需要再重新用maven下载遍依赖吗？
2：还是可以导入sbt下载的依赖jar包？

...全文

474 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

chen58683632 2018-02-09

打赏
举报

回复

eclipse下载sbt插件，然后导入项目就成了

本文档详细介绍了搭建SPARK源码阅读环境的步骤及方法。SPARK源码的阅读有助于了解SPARK运行的内部机制，便于优化，对有志于大数据学习及科研的人员都是很重要的。

spark 源码解读迷你书，推荐先搭建好环境，intelij整好，开看

本节内容主要包括Spark简介、Spark集群安装、Spark开发环境搭建、Spark源码阅读环境及Spark应用程序调试。

在深入了解一个系统的原理、实现细节之前，应当先准备好它的源码编译环境、运行环境。如果能在实际环境安装和运行Spark，显然能够提升读者对于Spark的一些感受，对系统能有个大体的印象，有经验的技术人员甚至能够猜出一些Spark采用的编程模型、部署模式等。当你通过一些途径知道了系统的原理之后，难道不会问问自己？这是怎么做到的。如果只是游走于系统使用、原理了解的层面，是永远不可能真正理解整个系统的。很多IDE本身带有调试的功能，每当你阅读源码，陷入重围时，调试能让我们更加理解运行期的系统。如果没有调试功能，不敢想象阅读源码的困难。本章的主要目的是帮助读者构建源码学习环境，主要包括以下内容：在windows环境下搭建源码阅读环境；在Linux搭建基本的执行环境；Spark的基本使用，如spark-shell。《深入理解SPARK：核心思想与源码分析》结合大量图和示例，对Spark的架构、部署模式和工作模块的设计理念、实现源码与使用技巧进行了深入的剖析与解读。, 《深入理解SPARK：核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析，旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家撰写。, 本书分为三篇：, 准备篇（第1～2章），介绍了Spark的环境搭建、设计理念与基本架构，帮助读者了解一些背景知识。, 核心设计篇（第3～7章），着重讲解SparkContext的初始化、存储体系、任务提交与执行、计算引擎及部署模式的原理和源码分析。通过这部分的内容，读者可以通过源码剖析更加深入理解Spark的核心设计与实现，以便在实际使用中能够快速解决线上问题并对性能进行调优。, 扩展篇（第8～11章），主要讲解基于Spark核心的各种扩展及应用，包括SQL处理引擎、Hive处理、流式计算框架Spark Streaming、图计算框架GraphX、机器学习库MLlib等内容。通过阅读这部分内容，读者可以扩展实际项目中对Spark的应用场景，让Spark焕发活力。

基于Spark的电影推荐系统，python爬取数据并采用Django搭建系统（源码）内附详细说明文档，期末作业，毕业设计都可用。系统架构的实现系统的架构分为数据获取层，数据处理层，数据存储层，业务层，展示层。展示层包括了Web的前后台两部分，前台是为了用户来查看电影数据和推荐系统向用户展示推荐数据页面，后台是管理员管理用户和电影数据的页面。业务层是对前后台业务功能进行实现的代码逻辑层。数据计算层是用来对数据做统计分析，和运行推荐算法的。通过对数据存储层里的基础数据和用户行为数据做计算推荐，得到的结果重新存入数据存储层中。数据获取层用以获取本推荐系统所需要的大量基础数据，并进行数据预处理，使之规整以后便存入数据存储层中。

1,258

社区成员

1,168

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章