我正在开发一个报告工具,我需要找出集群上所有用户执行的火花作业的已保存RDD的输出位置。我尝试了火花历史服务器 API/火花事件日志/火花侦听器/YARN 日志,但无法在那里获得已执行作业的位置。
提前谢谢你...
最终输出位于您传递给HadoopRDD或数据帧上调用的{{write(path: String)}}的路径下。
我正在开发一个报告工具,我需要找出集群上所有用户执行的火花作业的已保存RDD的输出位置。我尝试了火花历史服务器 API/火花事件日志/火花侦听器/YARN 日志,但无法在那里获得已执行作业的位置。
提前谢谢你...
最终输出位于您传递给HadoopRDD或数据帧上调用的{{write(path: String)}}的路径下。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium