sc.Addfile投掷错误= 2,在集群模式下没有此类文件或目录



我正在尝试使用spark's Pipe((运行R脚本将RDD供电到RScript。我正在使用sc.addfile((将RScript复制到执行者的内存。

sc.addFile(rScript) and using SparkFiles.get(rName) to get the file name.

在运行作业集群模式时,我要低于错误

Cannot run program "/data/tmp/spark-b8b8053e-0110-4ddb-91a3-
ae6f0f633c68/userFiles-78ed11c0-483b-4615-88eb-
8d1c97571997/RSCRIPT_NAME.R": error=2, No such file 
or directory

但文件已复制到/data/tmp/spark b8053e-0110-4DDB-91A3- AE6F0F633C68/USERFILES-78ED11C0-483B-4615-88EB-- 8D1C97571997位置。

不确定如何解决此问题。

我认为您正在尝试执行它

rdd.pipe("scriptName.R")

请在调用脚本之前添加" ./"。

rdd.pipe("./scriptName.R")

最新更新