隐藏侧边栏← 显示侧边栏→

个人资料

username

Spark论坛

版面简介:Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
版主: zhong930 Ico_application
标题 分数 提问人 回复数 最后更新时间 功能
[置顶] CSDN Spark微信群深度分享预告与总结 [云计算 Spark] 20 zhong930
2015-07-31 18:18
6 zcinfo
2017-06-14 09:58
管理
[置顶] CSDN攒课第二期课题“Spark基础与编程模型”开课啦,快来报名吧! [推荐] [云计算 Spark] 40 rmyymr
2015-10-27 18:29
13 ddjj_1980
2017-07-11 10:25
管理
[置顶] Spark零基础入门系列在线视频培训入口 [云计算 Spark] 40 zhong930
2015-12-08 20:55
7 maks2013
2017-03-21 11:08
管理
[置顶] [重磅]懂行的人都在这里,BDTC 2016将于12月8-10日在京举行 [云计算 Spark] 40 karamos
2016-11-23 13:20
1 GWLCGL520
2016-11-26 09:42
管理
Ubuntu下scala版本的eclipse打不开,求救,报错了好多 [云计算 Spark] 50 kong1287988804
2017-11-18 22:57
1 dljxyc
2017-11-18 23:27
管理
spark on yarn 跨集群访问带有Kerberos的HDFS数据报错 [云计算 Spark] 40 baiyujian082
2017-07-12 09:09
5 ffbinhcj
2017-11-17 17:34
管理
spark开发遇到报找不到类,求助高手!!! [高性能开发 分布式计算/Hadoop] 100 zhw1058
2017-11-17 16:47
0 zhw1058
2017-11-17 16:47
管理
kafka [云计算 Spark] 50 weixin_28977419
2017-11-17 14:02
0 weixin_28977419
2017-11-17 14:02
管理
spark分析效率比较 [云计算 Spark] 50 extend
2017-09-27 13:25
1 extend
2017-11-15 08:34
管理
spark streaming中建立线程池的问题求助 [云计算 Spark] 50 sinat_27634939
2017-11-12 16:53
2 sinat_27634939
2017-11-14 23:00
管理
spark 里的一个新手问题 [云计算 Spark] 50 applezjm
2017-11-11 23:42
0 applezjm
2017-11-11 23:42
管理
sqoop1 用Java从MySQL导数据到HDFS任务失败 [云计算 Spark] 50 qiaotongzxcv
2017-11-10 16:59
0 qiaotongzxcv
2017-11-10 16:59
管理
求助:spark on yarn中client模式报错 [云计算 Spark] 40 demonwang1025
2017-02-27 16:36
4 m0_37749191
2017-11-08 09:39
管理
spark 多个特征做onehot,怎么做效率高点? [云计算 Spark] 40 chuncun
2017-08-23 16:37
1 m0_37245752
2017-11-06 17:29
管理
大数据 JAVA spark 如何分析多文件protobuf gzp文件 实现报表统计 [云计算 Spark] 50 qq_37148509
2017-11-04 21:38
0 qq_37148509
2017-11-04 21:38
管理
spark读取不了hbase中的数据 [云计算 Spark] 50 qw6011036
2017-11-03 14:34
0 qw6011036
2017-11-03 14:34
管理
如何理解Spark是基于工作集的应用这句话? [云计算 Spark] 100 sinat_27976951
2017-11-02 15:06
0 sinat_27976951
2017-11-02 15:06
管理
请问各位大佬:如何为df或者rdd增加一个新的自增列 [云计算 Spark] 50 qq_21752135
2017-11-01 02:20
2 link0007
2017-11-01 17:08
管理
怎么计算 一个spark的算子执行的时间 [云计算 Spark] 50 u012260355
2017-10-31 21:08
0 u012260355
2017-10-31 21:08
管理
有关使用spark进行数据处理的问题 [云计算 Spark] 60 sinat_30665603
2017-06-21 16:32
7 qq_34969081
2017-10-31 17:20
管理
请问下大佬们公司开发spark项目用的是java还是scala [云计算 Spark] 100 MrAmity
2017-10-30 13:49
2 MrAmity
2017-10-31 17:12
管理
pyspark如何实现相邻两行相减? [云计算 Spark] 50 dickwxyz
2017-10-31 16:29
0 dickwxyz
2017-10-31 16:29
管理
scala开发插件匹配 [云计算 Spark] 50 live801
2017-10-30 00:51
1 live801
2017-10-31 00:20
管理
spark中获取同一文件夹中的每个文件的前五行内容,并获取每个文件的文件名 [企业IT 企业信息化] 0 lmj199582
2017-10-30 19:03
0 lmj199582
2017-10-30 19:03
管理
spark中累加器问题 [高性能开发 分布式计算/Hadoop] 0 ITqingliang
2017-10-26 20:50
0 ITqingliang
2017-10-26 20:50
管理
Spark中累加器问题 [高性能开发 分布式计算/Hadoop] 0 ITqingliang
2017-10-26 20:40
0 ITqingliang
2017-10-26 20:40
管理
Spark源码编译问题 [云计算 Spark] 25 u014512572
2017-10-23 17:09
1 flecks
2017-10-26 13:56
管理
getPartition中的参数numPartitions是怎么获取的? [云计算 Spark] 20 watcher1230
2017-09-28 15:45
2 imust118
2017-10-24 14:54
管理
spark MLlib中协同过滤算法接受的userId是int类型,但是真正的ID是字符串,怎么映射好呢? [云计算 Spark] 40 Evil_Logic
2016-02-19 14:20
5 wrty1993
2017-10-24 10:31
管理
hive udf连接hbase 无限等待问题 [云计算 Spark] 40 chjbiao
2017-10-23 22:27
0 chjbiao
2017-10-23 22:27
管理
mongodb 的优化 与使用spark连接 [高性能开发 高性能数据库开发] 20 yisun123456
2017-10-23 14:32
1 u013517141
2017-10-23 14:42
管理
hive jdbc 不支持批处理? 怎么能达到相同效果 [云计算 Spark] 40 kaaosidao
2017-10-22 17:49
0 kaaosidao
2017-10-22 17:49
管理
hadoop初级问题 [云计算 Spark] 20 u011652236
2017-10-21 16:27
4 anhaodai
2017-10-22 12:10
管理
scala学习 方法、函数的定义 [云计算 Spark] 20 live801
2017-10-21 01:06
0 live801
2017-10-21 01:06
管理
scala ide for eclipse搭建spark源码阅读环境报错 [云计算 Spark] 40 jiangsha2012
2017-10-19 21:37
0 jiangsha2012
2017-10-19 21:37
管理
spark读取hbase时,报出java.lang.NoClassDefFoundError: org/apache/htrace/Trace异常 [云计算 Spark] 25 weixin_35101855
2017-10-18 17:34
2 weixin_35101855
2017-10-19 12:34
管理
Spark上用saveAsHadoopDataset向hbase保存数据,长时间等待! [云计算 Spark] 100 pjh159
2016-08-25 17:49
5 weixin_35101855
2017-10-18 18:00
管理
hadoop环境变量配置 [云计算 Spark] 40 qq_39479684
2017-09-24 00:12
4 liang202
2017-10-18 17:04
管理
Eclipse for scala编译spark源码报错 [云计算 Spark] 40 jiangsha2012
2017-10-17 10:08
0 jiangsha2012
2017-10-17 10:08
管理
程序跑一段时间就会出这个异常 [云计算 Spark] 40 qq_36342697
2017-10-16 09:25
0 qq_36342697
2017-10-16 09:25
管理
Spark Streaming 如何保证数据不丢失 [云计算 Spark] 20 SeaTalks
2017-10-12 01:47
1 SeaTalks
2017-10-14 19:18
管理
storm适合虚机环境吗 [云计算 Spark] 40 u013215823
2017-07-11 23:31
2 SeaTalks
2017-10-14 19:15
管理
为什么spark sql有些任务特别慢?基本同样的input和shuffle数据量,大多数任务不到10几分钟就结束了,但有几个任务要30分钟以上? [云计算 Spark] 40 flyaga
2017-10-08 11:40
4 flyaga
2017-10-10 17:27
管理
spark读取hbase空指针异常,跪求大神指导 [云计算 Spark] 80 dingyuanpu
2015-07-20 22:17
3 xiashiwendao
2017-10-10 15:10
管理
如何实现利用局域网中空闲资源提高hadoop集群的性能? [云计算 Spark] 50 achilleswp2017
2017-10-09 22:48
1 alinly
2017-10-10 13:33
管理
求教,如何把数据行列转换? [云计算 Spark] 40 qq_35707207
2017-10-09 10:00
1 qq_35707207
2017-10-09 10:47
管理
Spark streaming 线程死锁 [云计算 Spark] 40 Joy_s
2017-10-06 17:08
0 Joy_s
2017-10-06 17:08
管理
有什么方式能让java后台程序直接调用spark,并且直接收到spark计算后的返回值? [云计算 Spark] 23 wangjicongqian
2017-06-24 08:32
9 aWDac
2017-10-04 11:16
管理
用的cloudera-manager搭建的spark集群hadoop啥的都好使,spark-shell出现这个问题,求大神解决 [云计算 Spark] 40 weixin_40091905
2017-09-04 10:09
1 d521000121
2017-09-30 09:55
管理
标题 分数 提问人 回复数 最后更新时间 功能