隐藏侧边栏← 显示侧边栏→

个人资料

username

Spark论坛

版面简介:Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
版主: zhong930 Ico_application
标题 分数 提问人 回复数 最后更新时间 功能
[置顶] 2017中国开发者有奖大调查 [推荐] [云计算 OpenStack] 100 CSDN__BBS
2017-12-08 10:39
62 Qaz_wz
2018-01-21 08:03
管理
[置顶] 【华为云市场】“吐槽有礼 no 吐 no 快”--求批评我们是认真的(活动时间:1/11--1/31) [推荐] [云计算 华为云计算] 50 CSDNhanrui
2018-01-18 11:01
43 K1rWf4
2018-01-19 17:12
管理
[置顶] CSDN Spark微信群深度分享预告与总结 [云计算 Spark] 20 zhong930
2015-07-31 18:18
6 zcinfo
2017-06-14 09:58
管理
[置顶] CSDN攒课第二期课题“Spark基础与编程模型”开课啦,快来报名吧! [推荐] [云计算 Spark] 40 rmyymr
2015-10-27 18:29
13 ddjj_1980
2017-07-11 10:25
管理
[置顶] Spark零基础入门系列在线视频培训入口 [云计算 Spark] 40 zhong930
2015-12-08 20:55
7 maks2013
2017-03-21 11:08
管理
[置顶] [重磅]懂行的人都在这里,BDTC 2016将于12月8-10日在京举行 [云计算 Spark] 40 karamos
2016-11-23 13:20
1 GWLCGL520
2016-11-26 09:42
管理
idea 开发spark程序提交集群运行总是报错ClassCastException: cannot assign instance of scala.coll [云计算 Spark] 50 u011512492
2018-01-20 01:51
1 u011512492
2018-01-20 01:58
管理
spark javeRDD 和DataFrame怎么管理数据库连接 [云计算 Spark] 50 kingisee
2018-01-19 19:36
0 kingisee
2018-01-19 19:36
管理
大数据技术之spark技术内幕.zip下载 [站务专区 下载资源悬赏专区] 0 RSS_40728440
2018-01-19 13:06
0 RSS_40728440
2018-01-19 13:06
管理
Spark MLlib机器学习实践下载 [站务专区 下载资源悬赏专区] 0 RSS_40728440
2018-01-19 11:40
0 RSS_40728440
2018-01-19 11:40
管理
spark2.x版本后,如何通过java在windows下将spark程序提交到yarn [云计算 Spark] 50 Coder_Lotus
2018-01-19 10:22
0 Coder_Lotus
2018-01-19 10:22
管理
Spark 1.6.2 dataframe 如何插入到 Hive 表 [云计算 Spark] 50 guostong
2017-11-27 08:26
2 zhang5059
2018-01-19 09:27
管理
spark streaming读取数据并进行词频统计报错java.lang.NoClassDefFoundError: net/jpountz/util/Saf [云计算 Spark] 50 q996676479
2017-12-11 14:08
1 zhang5059
2018-01-19 09:10
管理
spark sql 执行完毕后,落地小文件太多 [云计算 Spark] 200 qq_36584537
2017-12-15 17:46
2 zhang5059
2018-01-19 09:11
管理
spark RDD中的元组如何按照指定格式保存到HDFS上? [云计算 Spark] 50 sabiqusi
2017-12-21 13:57
2 zhang5059
2018-01-19 08:56
管理
spark笔记整理文档下载 [站务专区 下载资源悬赏专区] 0 RSS_40728440
2018-01-19 08:39
0 RSS_40728440
2018-01-19 08:39
管理
hadoop环境变量配置 [云计算 Spark] 40 qq_39479684
2017-09-24 00:12
6 u010719084
2018-01-18 17:10
管理
spark yarn集群报错 [云计算 Spark] 50 u010719084
2018-01-18 17:01
0 u010719084
2018-01-18 17:01
管理
spark 集群远程提交作业抛异常 [高性能开发 分布式计算/Hadoop] 50 gjw543314840
2018-01-17 16:39
0 gjw543314840
2018-01-17 16:39
管理
生成布隆过滤器后,广播到各节点,如何用它实现对表的过滤? [云计算 Spark] 50 chen_8703
2018-01-17 10:43
0 chen_8703
2018-01-17 10:43
管理
集群日志在哪? [云计算 Spark] 50 foxflyhigher
2018-01-09 16:22
2 share13619108
2018-01-16 16:46
管理
spark filter 过滤 [云计算 Spark] 50 weixin_36772742
2017-12-19 17:05
2 zhang5059
2018-01-16 15:16
管理
kafka0.8.1开发程序,启动后发现kafka.consumer.ConsumerIterator占用内存特别大 [云计算 Spark] 50 gjinge
2018-01-13 10:41
0 gjinge
2018-01-13 10:41
管理
spark源码阅读环境搭建问题 [云计算 Spark] 100 qq_27060875
2018-01-11 12:07
0 qq_27060875
2018-01-11 12:07
管理
yarn模式下提交的spark应用,其container资源是如何分配的? [云计算 Spark] 50 zylove2010
2018-01-10 15:48
0 zylove2010
2018-01-10 15:48
管理
Spark性能调优分享下载 [站务专区 下载资源悬赏专区] 0 yixiaof
2018-01-04 17:11
0 yixiaof
2018-01-04 17:11
管理
spark的function0用法咨询 [云计算 Spark] 50 follow_dream_lgx
2018-01-03 09:38
0 follow_dream_lgx
2018-01-03 09:38
管理
求助:spark on yarn中client模式报错 [云计算 Spark] 40 demonwang1025
2017-02-27 16:36
5 qq_36066039
2018-01-02 14:14
管理
spark环境安装的小问题,在线等! [云计算 Spark] 50 zgycsmb
2017-12-26 15:00
1 zgycsmb
2017-12-26 15:00
管理
求一个scala完成的并可运行的小项目或案例,在线等 [云计算 Spark] 50 zgycsmb
2017-12-20 14:20
1 zgycsmb
2017-12-26 14:51
管理
如何从服务器获取数据进行操作后返回数据库? [云计算 Spark] 50 qq_39873062
2017-12-26 09:53
0 qq_39873062
2017-12-26 09:53
管理
spark [云计算 Spark] 50 duoluzhen6004
2017-12-24 16:44
0 duoluzhen6004
2017-12-24 16:44
管理
关于在hadoop基础上安装spark的问题 [高性能开发 分布式计算/Hadoop] 50 xuepingsan
2017-12-24 12:03
0 xuepingsan
2017-12-24 12:03
管理
FAILED: SemanticException [Error 10006]: Partition not found 怎么解决删除分区表中分区数据? [云计算 Spark] 40 wuzhilon88
2016-03-28 16:50
1 xuyahui12
2017-12-22 00:05
管理
通过eclipse 提交sc.textFile("XX").count() 报错 [云计算 Spark] 40 qq_36947629
2017-07-31 17:13
5 javahuoshan
2017-12-21 15:08
管理
Spark.mllib中ALS predictAll返回结果缺失 [云计算 Spark] 100 cloudq1120
2017-12-19 17:23
0 cloudq1120
2017-12-19 17:23
管理
spark stand alone 模式集群 如何调用Java程序 [云计算 Spark] 50 andy88421
2017-12-19 15:22
0 andy88421
2017-12-19 15:22
管理
关于spark mllib中 FPM算法的性能问题 [云计算 Spark] 50 qmd1178920084
2017-12-18 16:14
1 qmd1178920084
2017-12-18 17:43
管理
请问各位大佬:如何为df或者rdd增加一个新的自增列 [云计算 Spark] 50 qq_21752135
2017-11-01 02:20
3 ollydebug
2017-12-18 09:40
管理
使用pyspark 进行mlllib 中lda 算法训练时,跑了500多个stage 都没结束。 [云计算 Spark] 50 yao544303963
2017-12-15 11:44
0 yao544303963
2017-12-15 11:44
管理
关于rdd写入hdfs数据 [云计算 Spark] 100 wjw870907
2017-12-07 16:43
4 wjw870907
2017-12-12 12:02
管理
大数据学习 [云计算 Spark] 50 east_ting
2017-11-29 21:42
6 chenshengshen
2017-12-10 09:17
管理
用MLib计算TF-IDF后如何从SparseVector获取idf-idf值对应的词? [云计算 Spark] 40 Frank_hxc
2015-08-15 13:26
5 CJ649934578
2017-12-07 17:19
管理
Spark Graphx怎样让一张图包含属性类型不同的边 [云计算 Spark] 50 officercat
2017-12-07 16:43
0 officercat
2017-12-07 16:43
管理
oozie 调度 spark on yarn 阻塞问题 [Java Java相关] 50 sinat_32638197
2017-12-07 10:10
0 sinat_32638197
2017-12-07 10:10
管理
Spark机器学习库之数据类型——scala版本 [云计算 Spark] 20 hello577
2015-03-23 10:36
8 gaowei1575019...
2017-12-06 09:25
管理
如何在代码中通过API监控Hadoop、Spark任务的进度和结果? [云计算 Spark] 40 bangbong
2016-05-02 10:56
11 amen000
2017-12-04 21:37
管理
spark读取不了hbase中的数据 [云计算 Spark] 50 qw6011036
2017-11-03 14:34
2 Zonzereal
2017-12-04 20:07
管理
Spark分析Log文件的方式 [云计算 Spark] 100 extend
2017-09-27 11:10
1 extend
2017-12-04 09:29
管理
spss存在多重共线性问题 [云计算 Spark] 50 Husanchy_lee
2017-12-03 17:20
0 Husanchy_lee
2017-12-03 17:20
管理
spark MLlib中协同过滤算法接受的userId是int类型,但是真正的ID是字符串,怎么映射好呢? [云计算 Spark] 40 Evil_Logic
2016-02-19 14:20
6 amen000
2017-12-02 20:13
管理
MatrixFactorizationModel中recommendProductsForUsers方法在数据量较大时执行失败问题 [云计算 Spark] 100 amen000
2017-12-02 19:57
0 amen000
2017-12-02 19:57
管理
Spark集群 Exception in thread "main" java.lang.NullPointerException的一个错误 [云计算 Spark] 30 jiang_jinyue
2016-12-12 16:25
2 jiang_jinyue
2017-11-28 21:13
管理
标题 分数 提问人 回复数 最后更新时间 功能