Hive SQL 数据中文乱码,如何过滤

求知小孩儿 2019-08-08 10:00:06
由于文件批量导入HIVE SQL中时,没有对每个文件进行utf-8的设置,可能一个文件中的数据也有不同的编码格式。入库后发现部分乱码,怎么样才能过滤出中文乱码?因为总量200万数据,可能就几十条乱码。有没有什么语句可以筛选出来呢?谢谢!!
...全文
803 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
Edmond1023 2019-08-09
  • 打赏
  • 举报
回复
没有办法了 因为你所有的文件的字符集编码不是一种 ,所以只能在hive外将所有文件的字符集编码转换为utf_8之后再进行load

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧