信令数据的架构设计

zhangsanwhereboy 2016-02-23 04:31:48
我在处理20亿的信令数据,有几个问题想问下大家,谢谢】


目前数据文件是文本文件,就是文本文件的数据。
------------------------------------------------------------------------
1 数据源如何获取和组织存储到HDFS上
2 数据清洗、规则XML配置
3 ETL具体过程有
抽取,清洗,转换,加载,存储等环节
4 MapReduce关键组件设计
5 详表如果存到hbase里,如何汇总统计,分层的逻辑模型分别是如何组织和存储的。
6 上层应用和报表工具怎么获取数据。
7 请考虑技术上的数据规模/汇总、详单查询、切片汇总查询的效率如何考虑和满足。
...全文
189 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

547

社区成员

发帖
与我相关
我的任务
社区描述
Cloud Foundry是业界第一个开源PaaS云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。
社区管理员
  • Cloud Foundry社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧