千亿级大数据如何存储的问题？

bandaoyu 2018-11-22 09:59:01

数据源：

我们系统监控的终端设备

——————————————————

每10秒产生一条记录

每年：24*60*60*365/10 = 3153600 约315万

—————————————————

每个场站100台，每年

100*315 = 3亿

_______________

500个场站，那么就是3000亿记录，每1000条记录的大小约0.25353M，3000亿既：约36.25T

—————————————————

存储最近2年的数据

2*36.25 = 72.5 T

——————————————————

服务器端：

数据库构架？

问：1、我们应该用什么数据库存储，用什么方案/框架？

2、Hadoop说的大数据是指处理的数据量大还是存储的数据量大？适合这里吗

...全文

3298 40 打赏收藏转发到动态举报

写回复

用AI写文章

40 条回复

切换为时间正序

请发表友善的回复…

发表回复

AT152S 2019-11-05

打赏
举报

mysql分布式咯

waleswood 2019-10-23

打赏
举报

应该用时序数据库

bandaoyu 2019-08-03

打赏
举报

引用 46 楼学海无涯回头是岸的回复：

用mysql分库分表应该可行

mysql的话，单表轻松过亿，这个不大好吧

学海无涯-回头是岸 2019-08-03

打赏
举报

用mysql分库分表应该可行

bandaoyu 2019-08-01

打赏
举报

主要是物联网 200多台设备，不停的产生数据，千亿级的数据，都存在一个表？如何设计后面的数据库？

AHUA1001 2019-08-01

打赏
举报

目前大部分数据库，都是支持的。如果需要实时存储，大数据就算了，大数据不适合短时间做大量的数据写入。

bandaoyu 2019-05-29

打赏
举报

引用 41 楼 asyqm 的回复:

引用 40 楼 bandaoyu 的回复:
[quote=引用 37 楼 asyqm 的回复:]

。
hadoop 应该还是可以用的，只不过不是直接用hadoop的 HDFS存储，用Hbase存储的吧

用肯定能用啊，但是hadoop应该关注在计算上，存储的事应该还是让存储来~~~[/quote]嗯嗯

asyqm 2019-05-26

打赏
举报

引用 40 楼 bandaoyu 的回复:

引用 37 楼 asyqm 的回复:
。
hadoop 应该还是可以用的，只不过不是直接用hadoop的 HDFS存储，用Hbase存储的吧

用肯定能用啊，但是hadoop应该关注在计算上，存储的事应该还是让存储来~~~

bandaoyu 2019-04-05

打赏
举报

引用 37 楼 asyqm 的回复:

。

hadoop 应该还是可以用的，只不过不是直接用hadoop的 HDFS存储，用Hbase存储的吧

bandaoyu 2019-04-05

打赏
举报

引用 38 楼 asyqm 的回复:

[quote=引用 36 楼大脸猫o 的回复:]
[quote=引用楼主 bandaoyu 的回复:]

那用什么存储你不要光批判又不给解决方案。不然就是愤青了

asyqm 2019-04-04

打赏
举报

引用 36 楼大脸猫o 的回复:

[quote=引用楼主 bandaoyu 的回复:]
数据源：

我们系统监控的终端设备

——————————————————

每10秒产生一条记录

每年：24*60*60*365/10 = 3153600 约315万

—————————————————

每个场站100台，每年

100*315 = 3亿

_______________

500个场站，那么就是3000亿记录，每1000条记录的大小约0.25353M，3000亿既：约36.25T

—————————————————

存储最近2年的数据

2*36.25 = 72.5 T

——————————————————

服务器端：

数据库构架？

问：1、我们应该用什么数据库存储，用什么方案/框架？

2、Hadoop说的大数据是指处理的数据量大还是存储的数据量大？适合这里吗

看具体业务需求吧，如果数据的用处是实时查询，那么还是用传统的库吧，分库分表呗，保留一年数据，以前的备份到备份磁盘上，
偏向于分析汇总的数据，就上hadoop吧，这个存储的数据量满足你的需求，计算能力也更适合你这个数据级别的计算，传统库千万级别的join就到瓶颈了。[/quote]
用Hadoop当存储用是极大的资源浪费。。。

asyqm 2019-04-04

打赏
举报

引用 35 楼 bandaoyu 的回复:

引用 34 楼 asyqm 的回复:
如果都是文件，建议上对象存储。同时搭配小文件打包等功能，能够实现很好的存储。
hadoop吗？

Hadoop可不是存储结构。Hadoop主要是做计算的，存储是兼职。海量存储基本对象是专业存储中唯一适合的解决方案了。

大脸猫o 2019-04-03

打赏
举报

引用楼主 bandaoyu 的回复:

数据源：

我们系统监控的终端设备

——————————————————

每10秒产生一条记录

每年：24*60*60*365/10 = 3153600 约315万

—————————————————

每个场站100台，每年

100*315 = 3亿

_______________

500个场站，那么就是3000亿记录，每1000条记录的大小约0.25353M，3000亿既：约36.25T

—————————————————

存储最近2年的数据

2*36.25 = 72.5 T

——————————————————

服务器端：

数据库构架？

问：1、我们应该用什么数据库存储，用什么方案/框架？

2、Hadoop说的大数据是指处理的数据量大还是存储的数据量大？适合这里吗