社区
云存储
帖子详情
hive运行在yarn中作业不运行
qq_32457341
2020-09-06 10:47:01
hive作业提交到hadoop的yarn上,发现作业并不运行,在yarn的资源调度上看到,所有的作业都在yarn上,都分配了最小的资源,但是却不运行,集群上每天都有成千上万个作业在跑,但很少出现这个问题,这是第二次出现
...全文
388
回复
打赏
收藏
hive运行在yarn中作业不运行
hive作业提交到hadoop的yarn上,发现作业并不运行,在yarn的资源调度上看到,所有的作业都在yarn上,都分配了最小的资源,但是却不运行,集群上每天都有成千上万个作业在跑,但很少出现这个问题,这是第二次出现
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
美团1万台 Hadoop 集群
YARN
的调优之路
背景
YARN
作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和
作业
调度。 美团的
YARN
以社区2.7.1版本为基础构建分支。目前在
YARN
上支撑离线业务、实时业务以及机器学习业务。 离线业务主要
运行
的是
Hive
on MapReduce, Spark SQL为主的数据仓库
作业
。 实时业务主要
运行
Spark Streaming,Flink为主的实时流计算
作业
。 机器学习业务主要
运行
TensorFlow,MXNet,MLX(美团点评自研的大规模机器学习系统)等计算
作业
。
YARN
面临高可用、扩展性、稳定性的问题很多。其
中
扩展性上遇到最严重的是集群和业务规模增长带来的调度器性
Hive
提交到
yarn
的任务一直在running问题排查-V2
解决
hive
已经停止的任务一直在
yarn
上
运行
的问题
Hive
提交到
yarn
的任务一直在running问题排查
一、问题描述 最近有数据平台的同学反馈
yarn
上面有一些任务跑了很久没有结束,状态一直处于running
中
。去Spark HistoryServer查看任务详情也没看到相关
运行
记录,需要人为手动kill任务才会停止并释放资源。 二、问题排查 从Spark HistoryServer可以看出,任务的Driver虽然启动了,但是并未执行job,并且一直阻塞在那没有退出。从
yarn
的角度来看,这个...
hive
指定
yarn
queue
Hive
提供三种可以改变环境变量的方法,分别是: (1)修改${
HIVE
_HOME}/conf/
hive
-site.xml配置文件; (2)命令行参数; (3)在已经进入cli时进行参数声明。下面分别来介绍这几种设定。 上述三种设定方式的优先级依次递增。即参数声明覆盖命令行参数,命令行参数覆盖配置文件设定。 方法一 在
Hive
中
,所有的默认配置都在${
HIVE
_HOME}/conf/h...
Hive
优化(提高
hive
运行
速度)
一、
Hive
使用本地模式执行操作(
Hive
使用资源大于20M的时候还是会采用集群
yarn
的方式
运行
) 将
hive
的job交给
yarn
执行太慢,
hive
支持本地模式 設置本地模式之前的,耗時 9.068 設置本地模式之后的,耗時 0.29 设置
hive
基于本地模式的方法 1、设置临时的 在每次执行hql语句之前 都要先执行下面这句话 set
hive
.exec.mode.local.auto...
云存储
932
社区成员
652
社区内容
发帖
与我相关
我的任务
云存储
云计算 云存储相关讨论
复制链接
扫一扫
分享
社区描述
云计算 云存储相关讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章