hive、hbase中文件存储的相关问题
最近也学习hadoop,也看了好多资料,对于hadoop中的hive、hbase和hdfs直接的关系有些迷惑,能否帮忙解答下,下面算是一个例子。
现想从oracle导一份数据到hadoop,然后希望这份数据hive和hbase同时都可以访问,我想咨询下面几个问题:
1、是否只能将oracle中数据生成文件到ftp主机上,基于ftp主机上的文件分别入库到hive和hbase?是否可以通过ftp主机文件入库到hive,在将hive可访问的文件入库到hbase?
2、hive和hbase所访问的底层文件是否一个,如果不是一个,我想了解下,一个30G的文件,入库到hadoop,同时让hive和hbase查到,那这个文件是否在hadoop中是存在两份,即60G的?
3、能否细致的说下hive和hbase所访问的基于hdfs的文件机制。。是否/user/hive/warehouse下的文件就是hive中的分布式文件,此文件hbase可查么。。。