海量数据分析与Redis大数据迁移【技术讨论】

Adela可爱多 2013-04-25 04:31:47
加精
http://huiyi.csdn.net/community/view/290
海量数据分析与Redis大数据迁移【技术讨论】

欢迎研发人员、产品经理、项目经理、网站分析从业者和爱好者、网站运营人员、网络营销人员等等感兴趣的人来参加!

一、大数据迁移redis实战经验
讲师:文承科
介绍:战斗在一线的程序猿,目前在飞信任小兵一枚,分享一点Redis实战经验,欢迎大家来吐槽。
内容:性能评估;容量评估;连接数;LRU过期策略;持久化评估以及容灾方案。
二、行业主题数据多维分析
讲师:群山
简介:稳健、高效的数据分发系统,无人值守无故障运行;ETL转换与加载系统,能够自动整理与维护数据应用;统一、严谨的数据应用监控系统,能够自动监控与捕捉数据应用异常,并定期发送数据应用监控报告;
内容:金融相关行业主题数据多维分析,定制的应用;
三、基于java客户端的分库分表技术
讲师:罗立树
简介:就职京东商城,曾在阿里巴巴等电子商务公司工作过,有大规模高并发网站架构经验,做过第三方方支付架构改造,电子商务服务化方面的工作,分布式应用。
内容:海量关系型数据处理,介绍分库分表的技术和解决方案,根据业务场景如何做分库分表的实施、实现细节和案例分析。
四、说说程序猿们的那些倒霉事儿
讲师:老陈
简介:作为一名懂心理学的程序猿,目前就职于天道国际教育集团,负责企业IT建设。
内容:未来是属于懂心理学的程序猿的,思维方式足够改变你的命运,情商能够影响你的人生。筒子们,跟老陈一起聊聊人生吧!
http://huiyi.csdn.net/community/view/290
...全文
2431 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
山书生 2013-04-30
  • 打赏
  • 举报
回复
可惜,在北京~@
Gelopa 2013-04-29
  • 打赏
  • 举报
回复
恰好是周五啊,怎么去
iihero_ 2013-04-26
  • 打赏
  • 举报
回复
看起来不错哦。
sxwf2001 2013-04-26
  • 打赏
  • 举报
回复
好东西收藏起来
brook9231 2013-04-26
  • 打赏
  • 举报
回复
感谢楼主谢谢
u010288600 2013-04-26
  • 打赏
  • 举报
回复
感谢楼主谢谢
u010455446 2013-04-25
  • 打赏
  • 举报
回复
感谢LZ分享
clarkeQin 2013-04-25
  • 打赏
  • 举报
回复
(☆随缘☆) 2013-04-25
  • 打赏
  • 举报
回复
来学习,
⼤数据开源框架集锦 1 ⼤数据平台 Hadoop 离线数据的分布式存储和计算基础框架 分布式存储HDFS 离线计算引擎MapReduce 资源调度Apache YARN CDH 基于稳定版Hadoop及相关项⽬最成型的发⾏版本, 成为企业部署最⼴泛的⼤数据系统 可视化的UI界⾯中⽅便地管理 配置和监控Hadoop以及其它所有相关组件 简单来说将⼗⼏个hadoop开源项⽬集成在⼀起 HDP 基于hadoop⽣态系统开源组件构建的⼤数据分析平台 2 集群管理与监控 Cloudera Manager ⽤于部署和管理CDH集群的软件 Ambari Hadoop平台的管理软件,具备Hadoop组件的安装、管理、运维 3 ⽂件系统 HDFS 分布式⽂件系统 4 资源调度 YARN hadoop的资源管理和作业调度系统 5 协调框架 Zookeeper 分布式协调服务,解决分布式数据⼀致性⽅案 实现诸如数据发布 订阅、负载均衡、命名、集群管理 master节点管理 分布式锁和分布式队列 6 数据存储 Hbase 分布式⾯向列的NoSQL开源数据库 Cassandra 分布式的混合NoSQL数据库 ,还有C++版本ScyllaDB MongDB ⾯向⽂档的开源分布式数据库 Redis 开源的⽀持⽹络,基于内存可持久化⽇志,key-value数据库,可⽤于 数据库 缓存 消息中间件 Neo4j 开源⾼性能的NoSQL图形数据库 7 数据处理 MapReduce 分布式离线的计算框架 批处理 ⽇渐被spark和flink取代 Spark 通⽤的⼀站式计算框架 SparkCore批处理 SparkSQL交互式处理 SparkStreaming流处理 Spark Graphx图计算 Spark MLlib机器学习 Flink 流处理和批处理分布式数据处理框架 核⼼是⼀个流式的数据流执⾏引擎 类似于Spark 批处理 数据流处理 交互处理 图形处理和机器学习 Storm 分布式实时⼤数据处理系统 毫秒级别的实时数据处理能⼒ 实时分析的领导者 8 数据查询分析 Hive 基于hadoop的数据仓库,结构化 SparkSQL 处理结构化数据的spark组件 分布式的SQL查询引擎 Impala 实时交互SQL⼤数据查询引擎 Druid 实时⼤数据分析引擎 Elastic Search 分布式可扩展的实时搜索和分析引擎,基于Apache Lucene搜索引擎 9 数据收集 Flume 分布式海量⽇志采集、聚合和传输系统 Logstash 具有实时管道功能的开源数据收集引擎 10 数据交换 sqoop 数据迁移⼯具,⽤来在不同数据存储软件之间进⾏数据传输的开源软件 DataX 阿⾥巴巴开源的离线数据同步⼯具,⽤于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定 ⾼效的数据同步 11 消息系统 Pulsar 企业级分布式消息系统,有替代Kafka的趋势 Kafka 发布/订阅的消息系统,由Scala写成 RocketMQ 阿⾥巴巴分布式、队列模型的消息中间件 12 任务调度 Azkaban 批量⼯作流任务调度器,将所有正在运⾏的⼯作流的状态保存在其内存 Oozie 基于Hadoop的企业级⼯作流调度框架 将所有正在运⾏的⼯作流的状态保存SQL数据库 Cloudeara贡献给Apache的顶级项⽬ 13 数据治理 Ranger Hadoop 平台上并提供操作、监控、管理综合数据安全的框架 提供⼀个集中的管理机制,所有数据权限 Sentry Hadoop集群元数据和数据存储提供集中、细粒度的访问控制项⽬ 14 数据可视化 Kibana ⽤于和 Elasticsearch ⼀起使⽤的开源的分析与可视化平台 15 数据挖掘 Mahout 基于hadoop的机器学习和数据挖掘的⼀个分布式框架 Spark MLlib Spark的机器学习库 MADlib 基于SQL的数据库内置的可扩展的机器学习库 16 云平台技术 AWS S3 ⼀种对象存储服务,提供⾏业领先的可扩展性、数据可⽤性、安全性和性能 存储和保护各种⽤例数据 GCP Google提供的⼀套云计算服务 注册⼀个帐号,在分布在全球各地数⼗个google机房使⽤所有的基础架构服务

954

社区成员

发帖
与我相关
我的任务
社区描述
PostgreSQL相关内容讨论
sql数据库数据库架构 技术论坛(原bbs)
社区管理员
  • PostgreSQL社区
  • yang_z_1
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧