spark streaming, kafka导入数据到es性能调优

WAVwind 2017-03-01 11:23:50



主要代码如图, 求教如何提升性能, 将kafka数据导入到es
...全文
865 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
HelloWordSong 2018-10-10
  • 打赏
  • 举报
回复
pom依赖能发下吗?
LinkSe7en 2017-03-02
  • 打赏
  • 举报
回复
导入Es那块估计没什么好优化的。从Kafka接收数据那块可以优化。看看官方文档的KafkaUtils.createDirectStream
1.项目代码均经过功能验证ok,确保稳定可靠运行。欢迎下载体验!下载完使用问题请私信沟通。 2.主要针对各个计算机相关专业,包括计算机科学、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师、企业员工。 3.项目具有丰富的拓展空间,不仅可作为入门进阶,也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 4.当然也鼓励大家基于此进行二次开发。在使用过程中,如有问题或建议,请及时沟通。 5.期待你能在项目中找到乐趣和灵感,也欢迎你的分享和反馈! 【资源说明】 基于spark-streaming框架的实时计算系统源码+项目说明.zip 项目架构: 开发语言:Scala、Java 计算框架:Spark-Streaming 数据库:Redis、Elasticsearch 消息队列:Kafka 数据采集:Maxwell(离线)、Spark-Streaming(实时) 数据可视化:Spring-Boot、Echart 项目流程: 1、产生数据到MySQL; 2、使用Maxwell把数据从MySQL采集到Kafka; 3、ODS层Spark-StreamingKafka消费数据,对消费的数据进行分流处理,维度数据写入Redis,事实数据重新写入Kafka的不同主题; 4、DWD层Spark-Streaming再从相应的Kafka主题中消费数据,进行数据处理,写入到Elasticsearch; 5、通过Spring-Boot开发相关接口,从写入到Elasticsearch中读取数据并展示。 项目亮点: 解决从Kafka中消费数据时的漏消费、重复消费以及读取数据时的顺序问题。 publisher-realtime——数据可视化模块 sparkStreaming-realtime——实时计算模块

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧