提交Pyspark作业时的语法错误



我已经在Ubuntu 14上通过VMware设置了Hadoop和Spark。我试图在Spark/示例/...在独立模式下运行WordCount的Python脚本,但这是给出语法错误。

    ./bin/spark-submit --master yarn --deploy-mode client --executor-memory  2g  usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/spark/README.md'
     File "<stdin>", line 1
    ./bin/spark-submit --master yarn --deploy-mode client --executor-memory 1g 
    /usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/README.md'
        ^
    SyntaxError: invalid syntax

我是Spark的初学者,请告诉我如何解决它....

wordcount.py期望两个输入参数,请参见

我已经解决了此错误。使用单个参数指定文件路径。

,它无关紧要。

最新更新