hive备份数据恢复

不恋春夏恋秋冬 2017-07-10 04:05:45

使用insert overwrite local directory '/home/wyp/wyp' select * from wyp; 命令将hive数据表导出至本地，但是未指定分隔符，因此用notepad++打开发现分隔符为'SOH' ，现在想导回至hive，创建表时分隔符使用’SOH' 'x01' 空格等都不成功，都是所有内容放在第一个字段，其他字段为null。求大神解答，没有指定分割符如何导回hive

...全文

468 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

不恋春夏恋秋冬 2017-07-11

打赏
举报

回复

实验证明是自己傻缺了，使用分隔符‘\001’完美解决

hbase备份和数据恢复，hbase与hive的互导，hbase和hdfs互导。

【表恢复】无备份情况下，truncate表恢复 2012-11-19 13:15:29 分类： Linux 1、表是否能成功恢复，取决于被truncate了的表所占用的数据块是不是被新的段(表、索引等)所重用，如果被重用就无法完成这样的恢复了，看个人运气了。 2、需用到牛人写的恢复包，FY_Recover_Data。

⼤数据学习计划⼤数据学习计划⼤数据如此⽕热的现在，想必许多⼩伙伴都想要加⼊这个⾏业。也是我们今天就要拿出收藏已久的⼤数据学习计划。帮助你不⾛弯路，迈向⼤数据 1 ⼤数据应⽤离不开基础软件的⽀撑，且⼤部分⼤数据组件部署在 Linux 操作系统上的⽤户空间，也有很多组件也借鉴了Linux 操作系统的⼀些设计精髓，所以 Linux 既是⼤数据的强⼒⽀撑，也是很多性能问题的⽀撑者。同时数据库的相关知识也是必要的基础，熟悉 MySQL 数据库的安装与部署，还有备份和恢复等都是重点。所以在第⼀部分的学习中我们需要达到以下⽬标： 1、通过对 Linux 操作系统体系结构、服务管理、包管理、NTP 协议时间服务器、关系型数据库理论和 MySQL 数据库等相关知识的学习，掌握⼤部分安装部署 Hadoop 集群操作系统层⾯的技能，为后续搭建 Hdoop 集群、对⽐ RDBMS 与 NoSQL 数据库打基础。 2、通过对 Linux ⽂件系统、（⼤数据学习群142974151】内核参数、内存结构、以及 Java 虚拟机等相关知识的学习，为后续学习分布式⽂件系统， Hadoop 集群优化扫清操作系统层⾯知识的障碍 2 Hadoop 由许多元素构成。其最底部是HDFS，它存储 Hadoop 集群中所有存储节点上的⽂件。HDFS(对于本⽂)的上⼀层是MapReduce 引擎，通过对Hadoop分布式计算平台最核⼼的分布式⽂件系统HDFS、MapReduce处理过程，以及数据仓库⼯具Hive和分布式数据库Hbase 的介绍，基本涵盖了Hadoop分布式平台的所有技术核⼼。还有Flume是Cloudera提供的⼀个⾼可⽤的，⾼可靠的，分布式的海量⽇志采集、聚合和传输的系统，Flume⽀持在⽇志系统中定制各类数据发送⽅，⽤于收集数据。在⼤数据中也起到⼀定作⽤。本模块通过学习HDFS，YARN(MapReduce)Spark 等核⼼组件，了解Hadoop 的基本运⾏框架。所以在第⼆部分的学习中我们需要达到以下⽬标： 1、搭建单节点模拟分布式集群，熟悉 HDFS 命令; 掌握 HDFS 体系结构，读写流程，能 dump HDFS 元数据⽂件; 理解 Flume 组件架构，并能⽤ Flume 向 HDFS 平台导⼊⽂本⽇志; 2、搭建多节点、可扩展集群; 部署 HDFS HA 架构; 理解并实现 Hadoop YARN 的多租户架构掌握 Zookeeper 组件原理; 掌握 Hadoop 集群优化路径; 3 传统数据仓库在⾯对更⼤规模数据时显得⼒不从⼼，在寄希望于⼤数据平台时，MapReduce 编程门槛让很多数据分析师望⽽却步，⽽Hive 是基于Hadoop的⼀个数据仓库⼯具，可以将结构化的数据⽂件映射为⼀张数据库表，并提供简单的sql查询功能，可以将sql语句转换为 MapReduce任务进⾏运⾏。其优点是学习成本低，⼤数据学习kou群74零零加【41三⼋yi】可以通过类SQL语句快速实现简单的 MapReduce统计，不必开发专门的MapReduce应⽤，⼗分适合数据仓库的统计分析。本模块通过学习 Hive、Impala 等⼤数据 SQL 分析组件，让⽤户将隐匿在泥沙之下的数据价值挖掘出来。所以在第三部分的学习中我们需要达到以下⽬标： 1、安装部署 Hive; 理解 Hive 架构及执⾏原理 ; Hive 的优化(分区、桶) ; Hive SQL 语句优化; Hive 常见故障诊断; 4 在上个模块中，OLAP 类型的需求得到了很好的解决⽅案，即针对数据查询分析的应⽤。但是这些组件对于数据的随机删改并不擅长。针对此种 OLTP 类型应⽤，⼤数据⽣态系统中有另外⼀类组件处理这样的问题，那就是 NoSQL 家族。这部分将介绍 NoSQL 的数据模型和分类，着重讲述最具代表的 HBase。 ZooKeeper是⼀个分布式的，开放源码的分布式应⽤程序协调服务，，是Hadoop和Hbase的重要组件。它是⼀个为分布式应⽤提供⼀致性服务的软件，提供的功能包括:配置维护、名字服务、分布式同步、组服务等。在本部分也会涉及。所以在第四部分的学习中我们需要达到以下⽬标： 1 理解HBase 体系结构⽔平扩展的优势; 部署 HBase ; 设计 HBase 表; 在这⾥我还是要推荐下我⾃⼰建的⼤数据学习交流qq裙： 142974151，裙⾥都是学⼤数据开发的，如果你正在学习⼤数据，欢迎你加⼊，⼤家都是软件开发党，不定期分享⼲货（只有⼤数据开发相关的），包括我⾃⼰整理的⼀份2019最新的⼤数据进阶资料和⾼级开发教程，欢迎进阶中和进想深⼊⼤数据的⼩伙伴 2 理解 zookeeper 在 HBase集群

hive 数据备份 ##数据准备 hive> create table demo( > id int comment 'ID', > name string comment '名字') > row format delimited fields terminated by ','; OK Time taken: 0.18 seconds hive> load data local inpath '/data/lilin/demo.txt' into ta

本文说明如何通过把Hive中的数据备份到磁盘中，并从磁盘中恢复到Hive中。1，把Hive中的表数据备份到磁盘中。备份示例：use GRC_BIGDATA; insert overwrite local directory '/root/grc_bigdata/backup/src_companyinfo' ROW FORMAT DELIMITED FIELDS TERMINATED BY '|

其他数据库

2,209

社区成员

9,519

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章