从spark中如何 update cassandra数据表？

hghdown 2016-09-02 06:51:59

我想从spark中的计算结果存入cassandra，但是得使用update语句，哪位大神指导如何使用update语句更新表？

例子如下：在saveToCassandra 地方能否有update的方法？

lines.map( x=>((x._1,x._7),(x._5,x._6)) )
.reduceByKey((x,y) => (x._1+y._1,x._2+y._2))
.map(x=>(x._1._1, x._1._2, x._2._1,x._2._2))
.saveToCassandra("casdemo", "logt_stats", SomeColumns("accesstime","name", "count","bytes" ))

...全文

657 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

lf.D 2019-01-04

打赏
举报

回复

不知楼主具体应用场景。直接saveToCassandra的时候，数据包含原表的主键一致插入就相当于更新了。如原表为 id， name ， age 1 Li 18 2 Wang 20 PrimaryKey（id） 1 Zhang 22 直接插入somecolumn（id，name，age）就更新为： id， name ， age 1 Zhang 22 2 Wang 20 PrimaryKey（id）

LinkSe7en 2016-09-02

打赏
举报

回复

foreachPartition

开发运维资源，脚本，泊坞窗映像，工具和文档的集合，主要与用于本地开发，学习目的和快速原型制作的分布式系统有关。...# update requirements pip freeze > requirements.txt # run locally on port 80

Cassandra是一个分布式、高可扩展的数据库，用户可以创建线上应用程序，实时处理大量数据。　Apache Spark是应用于Hadoop集群的处理引擎，在内存条件下可以为Hadoop加速100倍，在磁盘上运行时也能实现十倍的加速。...

Presto的设计和编写完全是为了解决Facebook这样规模的商业数据仓库交互式分析和处理速度的问题 Presto可以做什么 Presto支持在线数据查询，包括Hive kafka Cassandra关系数据库以及专门数据存储，一条Presto查询...

之前两篇文章，简单的介绍了使用Spark通过CLI来进行读写Cassandra数据。在这一篇中，将介绍使用新的CQL来进行读取写入数据。第一步，还是一样的去配置SparkContext，唯一的区别是使用的InputFormat不同。在Cli...

Apachekafka是一个可扩展，高性能，低延迟的平台，允许我们像消息系统一样读取和写入数据。我们可以很容易地在 Java 中使用kafka。 sparkStreaming是 Apachespark的一部分，是一个可扩展、高吞吐、容错的实时流处理...

1,258

社区成员

1,168

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章