数据库选型建议
一、数据情况
历史数据:36TB
每天数据量:5G(数据只在每天7点到18点之间产生,其他时间没有数据)
数据类型:结构化的交易数据
二、业务需求
1、需要每天实时产生动态数据报表(每分钟)——涉及的商品种类在五千款左右。
2、能够实现对实时数据多维度的钻取——单个商品在既定时间段内的用户购买特征
3、数据挖掘——主要在于模型部署阶段需要对当天的所有交易数据进行监控。
三、硬件拥有情况
二十台左右服务器(4核CPU\8G内存)
问题:
是否有必要选择Hadoop或者其他Nosql数据库,还是先有关系型数据库可以满足以上需求?