sparksql2.0版本如何修改指定行的指定属性？

DEMO13 2021-05-10 11:28:30

sparksql2.0版本如何修改指定行的指定属性（Dateframe）

...全文

2580 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

arcane8964 2021-08-27

打赏
举报

回复

那要看改什么属性了。
下面的例子把所有ColumnName换成小写

scala> spark.version
res0: String = 2.4.7

scala> case class E(ID:Int, NAME:String)
defined class E

scala> val df = Seq(E(1,"N1"), E(2,"N2")).toDF
df: org.apache.spark.sql.DataFrame = [ID: int, NAME: string]

scala> df.printSchema
root
 |-- ID: integer (nullable = false)
 |-- NAME: string (nullable = true)


scala> df.show(false)
+---+----+
|ID |NAME|
+---+----+
|1  |N1  |
|2  |N2  |
+---+----+


scala> df.select(df.columns.map(x => col(x).as(x.toLowerCase)): _*).printSchema
root
 |-- id: integer (nullable = false)
 |-- name: string (nullable = true)


scala> df.select(df.columns.map(x => col(x).as(x.toLowerCase)): _*).show(false)
+---+----+
|id |name|
+---+----+
|1  |N1  |
|2  |N2  |
+---+----+

shiter 熟练 2021-07-02

打赏
举报

回复

应该可以用 withcolumn + udf 的方式进行修改

一，基本介绍 spark2.0版本以后存在的Sparksql的一些实用的函数，帮助解决复杂嵌套的json数据格式，比如，map和嵌套结构。Spark2.1在spark的Structured Streaming也可以使用这些功能函数。下面主要介绍： A：get_json_object() B：from_json() C：to_json() D：explode() E：selectExpr() 二，实例演示首先，创建一个没有任何嵌套的JSon Schema，在xshell和idea里.

第1章Spark SQL概述 1.1什么是Spark SQL Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。与基本的Spark RDD API不同，Spark SQL的抽象数据类型为Spark提供了关于数据结构和正在执行的计算的更多信息。在内部，Spark SQL使用这些额外的信息去做一些额外的优化，有多种方式与Spark SQL进行...

SPARKSQL3.0-Spark兼容多版本Hive源码分析

SparkSQL SparkSQL Table of Contents 1. SparkSQL 是什么 1.1. SparkSQL 的出现契机 1.2. SparkSQL 的适用场景 2. SparkSQL 初体验 2.3. RDD 版本的 WordCount 2.2. 命令式 API 的入门案例 2.2. SQL 版本 WordCount 3. [扩展] C...

零基础学sparksql

1,261

社区成员

1,169

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章