Hive分区Partition的数据如何更新

sunyanjie_china 2017-02-28 10:08:06
有张表的分区是以日期 datekey 分区的..
当更新历史数据的时候..是否需要删除原有分区再重新动态分区呢..

现在的语法是这样..


ALTER TABLE BSum_CrmProfile DROP PARTITION (Datekey='2017-02-26');
ALTER TABLE BSum_CrmProfile DROP PARTITION (Datekey='2017-02-27');
INSERT INTO TABLE BSum_CrmProfile PARTITION (DateKey)
SELECT MemberNumber,DateKey FROM CrmProfile WHERE DATEKEY IN ('2017-02-26','2017-02-27') GROUP BY MemberNumber,DateKey DISTRIBUTE BY DateKey;


先删除分区..然后使用 Insert into t1 select from t2 where in() 来重新动态的创建分区..

想问下如果将insert into 改为 insert overwrite .. 不手动删除分区..
语句会删除全部分区还是 只覆盖当前分区..
...全文
2380 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
sunyanjie_china 2017-02-28
  • 打赏
  • 举报
回复
无法结贴.. 也没人回答.. 来人的话..就说说通过Rest接口发布hive任务时.. 返回 输入线太长 the input line is too long.. 的问题吧..
sunyanjie_china 2017-02-28
  • 打赏
  • 举报
回复
错误了.. 使用分区的时候使用overwrite 会直接failed的.. 还是老老实实的手动删分区再重建吧..

932

社区成员

发帖
与我相关
我的任务
社区描述
云计算 云存储相关讨论
社区管理员
  • 云存储
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧