Log4j 在多个节点中创建日志.想要在一个节点中创建单个日志



我有一个多节点集群Spark集群。我正在使用 log4j 创建日志。正在创建日志,但群集中的所有节点都会创建一个。它们也是在/tmp 目录中创建的,而不是在任何其他目录中创建的。这是

spark2-submit --master yarn --deploy-mode cluster --files/path/log4j.properties --conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=log4j.properties" --

conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j.properties" --class com.dataLoad.Load_WF/path/LoadData.jar

如何将所有日志附加到一个日志文件而不是多个日志中?如何在 Linux 中/tmp 目录以外的目录中创建日志?示例代码将非常有助于理解。非常感谢。

在多节点 Spark 群集上,应用程序的日志由 Spark 驱动程序写入。

  • 如果在节点 A 上使用客户端模式执行,则日志将保存在节点上一个

  • 如果使用群集模式执行,则日志将保存在节点上,其中火花驱动程序正在运行。

我们遇到了同样的问题,我们发现的解决方案是使用 syslog 将每个节点的日志集中到同一节点上的所有应用程序。

在主节点上,您必须将系统日志配置为日志服务器。在/etc/syslog-ng/中,您必须编辑 syslog-ng.conf 以创建保存集中日志文件的目的地:

例:

@version: 3.5
@include "scl.conf"
@include "`scl-root`/system/tty10.conf"
    options {
        time-reap(30);
        mark-freq(10);
        keep-hostname(yes);
        };
    source s_local { system(); internal(); };
    source s_network {
        syslog(transport(udp) port(514));
        };
    destination df_local2 {
        file(
            "/var/log/MyClusterLogs/myAppLogs.$YEAR-$MONTH-$DAY.log"
            owner("user")
            group("user")
            perm(0777)
            ); };
    filter f_local2 { facility(local2); };
    log { source(s_network); filter(f_local2); destination(df_local2); };

然后,将 spark 应用程序的 log4j.properties 文件中的配置更改为指向系统日志服务器:

log4j.rootCategory=INFO,FILE,SYSLOG
log4j.appender.SYSLOG=org.apache.log4j.net.SyslogAppender
log4j.appender.SYSLOG.syslogHost=<syslog_server_ip>
log4j.appender.SYSLOG.layout=org.apache.log4j.PatternLayout
log4j.appender.SYSLOG.layout.conversionPattern=%d{ISO8601} %-5p [%t] %c{2} %x - %m%n
log4j.appender.SYSLOG.Facility=LOCAL2

最新更新