社区
张长志的课程社区_NO_1
大数据Spark实战视频教程
帖子详情
14常用的action操作
zhchzh1000
2023-01-12 18:48:27
课时名称
课时知识点
14常用的action操作
...全文
125
回复
打赏
收藏
14常用的action操作
课时名称课时知识点14常用的action操作
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Spark
常用
action
,及
操作
汇总
DataSet 的函数 详细API常见此链接
Action
操作
1、collect() ,返回值是一个数组,返回dataframe集合所有的行 2、collectAsList() 返回值是一个java类型的数组,返回dataframe集合所有的行 3、count() 返回一个number类型的,返回dataframe集合的行数 4、describe(cols: String*) 返回一个通过数学计算的类表值(count, mean, stddev, min, and max),这个可以...
Linux
常用
操作
命令大全
Linux
常用
操作
命令大全
Spark
常用
RDD
操作
spark
常用
RDD
操作
,
操作
包括两种类型,即转换(Transformation)
操作
和行动(
Action
)
操作
一、转换
操作
1、filter(func),筛选出满足函数func的元素,并返回一个新的数据集 例如: scala> val lines=sc.textFile(“file:///usr/local/spark/mycode/rdd/word.txt”) scala> val linesWithspark=lines.filter(line => line.contians(“
spark
常用
函数:transformation和
action
1、RDD提供了两种类型的
操作
:transformation和
action
所有的transformation都是采用的懒策略,如果只是将transformation提交是不会执行计算的,计算只有在
action
被提交的时候才被触发。 1)transformation
操作
:得到一个新的RDD,比如从数据源生成一个新的RDD,从RDD生成一个新的RDD map(func):对调用map的RDD数
总结
常用
的Transformation算子和
Action
算子,及基本用法
只有是
Action
时,才会执行立即
操作
。 Transformation是 lazy的
操作
,不会立即执行,执行Transformation的算子时,会返回一个新的RDD,依赖上一个RDD transformation: 1、sortBy : 对于RDD的是非元组型,rdd1.soreBy(x=>x),元组型按value排序 rdd.soreBy(_._2)(进行shuffle) 2、sor...
张长志的课程社区_NO_1
1
社区成员
357
社区内容
发帖
与我相关
我的任务
张长志的课程社区_NO_1
复制链接
扫一扫
分享
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章