spark driver日志配置和查看的问题

上岸の鱼 2016-08-15 05:05:08

master以yarn的方式跑，通过http://node1:18088/history/application_1470281024284_0054/executors/，可以看到如下图所示信息，

应用程序即driver的日志无法查看，我试过将logger.info改成logger.warn也看不到。
故请问：
1.driver的日志如何查看?
2.我的程序如何指定自己的log4j.properties，不要告诉我放到${SPARK_HOME}/conf/下，因为那会对所有spark应用都生效，我只想对自己这个应用生效；我试过把log4j.properties放到项目的resources下，但不管用。

...全文

936 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

此文已由作者岳猛授权网易云社区发布。欢迎访问网易云社区，了解更多网易技术产品运营经验。任何时候日志都是定位问题的关键，spark也不会例外，合适的配置和获取spark的driver，am，及executor日志将会提升问题定位的效率，这里初步整理了spark的一些配置，更好的日志配置还需要根据实际的情况。1）dirver日志的配置，可以通过spark.driver.extraJavaOptions...

一、各界面说明 1.1、查看YARN页面的driver日志可以在右侧搜索框中填对应application号找到任务，然后点击对应的application号链接，如下图所示：这样会进入该application的信息界面，“FinalStatus”显示了该application的最后状态，点击下方的“logs”按钮也会进入到driver日志界面，如下图所示：对于driver日志而言，代码中的println()和show()等函数的输出，一般都在stdout里，大部分重要的报错信息都在s

在测试spark计算时，将作业提交到yarn（模式–master yarn-cluster）上，想查看print到控制台这是imposible的，因为作业是提交到yarn的集群上，so 去yarn集群上看日志是很麻烦的，但有特别想看下print的信息，方便调试或者别的目的在Spark的conf目录下，把log4j.properties.template修改为log4j.properties

2) history-server配置，查看历史任务。打开http://spark服务器:18080。Spark版本：3.3.5。

在使用spark 环境开发时，有时为了方便，需要pyspark环境下执行一些代码，但默认的日志级别是INFO, 这样会输出超级多的日志，界面一几乎是一直在刷屏状态。可以调一下日志的输出级别。一、修改日志配置在$SPARK_HOME/conf 下找到 log4j.properties.template，复制一份到新文件log4j.properties 可直接修改文件名称为log4j.pr

1,273

社区成员

1,171

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章