数据整合方案

iloveyoujia 2013-12-05 04:04:14
加精
数据库是异构的,分布到全国各省。想要一个有效的整合方案。做数据的大集中。
数据特点:
1、数据量大,一天400T左右(网络使用专线)
2、数据要传明细;(如果数据不集中明细,有什么让应用能实时访问省级数据)
3、应用做分析的时候,能实时访问到各省数据。

不知道什么样的产品或者技术能支撑?如果是程序是否可靠,需要在省里面部署什么样的程序?
如果是数据库什么样的数据库可以支持?数据库联邦是否可靠?

国内外有没有类似的Case?


...全文
2235 43 打赏 收藏 转发到动态 举报
写回复
用AI写文章
43 条回复
切换为时间正序
请发表友善的回复…
发表回复
江南雪_158 2015-10-28
  • 打赏
  • 举报
回复
期待高人指点
wangsufu77 2013-12-24
  • 打赏
  • 举报
回复
六公子 2013-12-20
  • 打赏
  • 举报
回复
就没见楼主分享啊!400T的数据缺失挺海量的!
copy_paste 2013-12-20
  • 打赏
  • 举报
回复
我估计那明细表的结构,是很简单一种,类似操作,或终端类的定时数据 类似:objectID(对象ID), time(发生时间), data1, data2, data3... 然后目地是:各地WEB操作人员或用户会进行查看该明细或汇总或以此明细的增值数据。
jiebozhang 2013-12-17
  • 打赏
  • 举报
回复
不会是12306吧 顶一下
人鱼传说 2013-12-16
  • 打赏
  • 举报
回复
这么大的数据量,在这里解决不了,还是请专业的公司来做吧
ricetendto2 2013-12-13
  • 打赏
  • 举报
回复
膜拜,一天400T,顿时亚历山大,做个标记,未来可能会用到
xxfvba 2013-12-13
  • 打赏
  • 举报
回复
400T啊,我一开始还以为是400G呢,400G感觉就很大了,期待高人。
Mr_Nice 2013-12-13
  • 打赏
  • 举报
回复
中国有23个省,4直辖市,282个地级市,374个县级市 lz每天的数据这么大,可否在更小的级别进行局部统计,然后将统计结果上传汇总至一处,再进行更深的挖掘统计。 这样可以将负荷压在底端,不至于太大。 省级区分 400TB/23≈17.4TB 依然还是有点儿大,不过已然数据统计小了一个数量级 如果更加细分 17.4TB/省内各市 ,假设有20个市,就可以收敛到800GB左右,这个级别的数据量,Oracle,SQL Server,Mysql等就可以支持 同理,从数据的起点来源作为分析点,可以将数据量缩小到最小的数量级,从而减少统计的压力。 lz第3个需求,实际是明细的查询,(网络使用专线)的情况下,通过修改查询指向,就可以满足lz需求。 另外一个小小的疑问,400TB每天*365≈14.2PB级别的数据量 据不完全统计,NASA EOS对地观测系统三年数据:1PB,lz这个应用系统采集数据的能力之强大,叹为观止啊....
蛇图腾 2013-12-13
  • 打赏
  • 举报
回复
楼主是在什么大国企还是政府部门啊
句号先生123 2013-12-12
  • 打赏
  • 举报
回复
我是来看看怎么回事的
mbugaifc 2013-12-11
  • 打赏
  • 举报
回复
mtazrael 2013-12-11
  • 打赏
  • 举报
回复
数据库异构没有关系,给他们设定统一的协议和规约让他们给中心数据中心发送数据就行了,不过这样中心数据中心压力就大了很多。专线这个数据量的确可以满足,就是IO的读写压力蛋疼。是否有冗余数据,是否应该先从数据上看看。再考虑技术方案,如果确定必须400T每天,那在考虑具体部署方式吧
lene3 2013-12-11
  • 打赏
  • 举报
回复
这帖子推荐了,只是更多的人来看,凑个热闹,至于楼主最后咋解决的,也都不知道。
君子之风-- 2013-12-10
  • 打赏
  • 举报
回复
拜读了。
zark 2013-12-10
  • 打赏
  • 举报
回复
见识了。。。
飞啊子 2013-12-10
  • 打赏
  • 举报
回复
等大牛。
liuhuili23 2013-12-10
  • 打赏
  • 举报
回复
一个服务器要处理这么大数据量,是够牛,干吗不从服务器部署上考虑
nnbuchicao 2013-12-10
  • 打赏
  • 举报
回复
可能是某处经费,不差钱
guguda2008 2013-12-09
  • 打赏
  • 举报
回复
一天完成400T的传输?搞笑吧,你打算用存储设备存呢? 各地明细数据自己做汇总后再传到总部作分析,不要直接传明细数据。过期的明细数据直接删掉,不然你有多少钱也够不上买存储的钱。
加载更多回复(15)

27,579

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 应用实例
社区管理员
  • 应用实例社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧