占用3.6T的硬盘的一个表,想存放到hbase里,需要用多少个计算机、怎样的硬件呢?
请教大家一个问题,很头疼:
一个很大的表,假定叫t表;其中有360亿条记录,大概占用3.6T的硬盘空间;
对该t表插入数据的方式非常简单,最普通的插入数据的方式;
对该t表读取数据的方式只有一种非常简单的方式,类似于 select ... from t where a = .. and b = ..,读取的并发量不大;
也就是:对t表的使用非常简单;只是数据量非常大;占用硬盘非常大;
现在想使用hbase存储、读取t表的数据;由于没有hbase、hadoop、zokeeper的任何项目经验,由于现在需要估算硬件情况,想请教大家一下:
1,需要几个计算机?每个计算机的作用是什么(比如zookeeper使用几个计算机、hadoop使用几个计算机、hbase使用几个计算机等)?每个计算机的CPU/内存/硬盘各是多少?
2,如果购买云主机,哪个公司的比较便宜、稳定?