我正在做一个项目,我需要在我的 Scala 应用程序中执行一些 linux 命令(sqoop 命令(。请参阅我尝试在 VM 上使用 MySql 执行的示例命令。
import sys.process._
"sqoop eval --connect jdbc:mysql://localhost:3306/retail_db --username root --password cloudera --query 'select * from categories'".!
我收到以下错误:
Warning: /usr/lib/sqoop/../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
20/06/24 15:25:27 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6-cdh5.13.0
20/06/24 15:25:27 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure.
Consider using -P instead.
20/06/24 15:25:27 ERROR tool.BaseSqoopTool: Error parsing arguments for eval:
20/06/24 15:25:27 ERROR tool.BaseSqoopTool: Unrecognized argument: *
20/06/24 15:25:27 ERROR tool.BaseSqoopTool: Unrecognized argument: from
20/06/24 15:25:27 ERROR tool.BaseSqoopTool: Unrecognized argument: categories
我也使用了这个命令,我收到了相同的错误消息:
"sqoop eval --connect jdbc:mysql://localhost:3306/retail_db --username root --password cloudera --query 'select * from categories'".!<
有人可以帮助我找出错误的原因吗?我尝试使用单引号和双引号,但都无济于事。我搜索了SO的各个地方,但我无法得到任何解决方案。这就是我在这里发帖的原因。 注意:相同的命令在 pyspark 中成功执行,如下所示:
>>> import os
>>> import sys
>>> query = "sqoop eval --connect jdbc:mysql://localhost:3306/retail_db --username root --password
cloudera --query 'select * from categories'"
>>> os.system(query)
Warning: /usr/lib/sqoop/../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
20/06/24 15:28:56 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6-cdh5.13.0
20/06/24 15:28:56 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure.
Consider using -P instead.
20/06/24 15:28:58 INFO manager.MySQLManager: Preparing to use a MySQL streaming resultset.
----------------------------------------------------
| category_id | category_department_id | category_name |
----------------------------------------------------
| 1 | 2 | Football |
| 2 | 2 | Soccer |
| 3 | 2 | Baseball & Softball |
| 4 | 2 | Basketball |
| 5 | 2 | Lacrosse |
| 6 | 2 | Tennis & Racquet |
看起来sqoop
不承认*
、from
和categories
是单独的参数。从命令行调用时它起作用的原因是 shell 解释引号并将它们显示为单个select * from categories
参数。换句话说,shell 在将所有内容交给sqoop
程序之前会进行一些预处理。
.!
方法(即ScalaProcessBuilder
(直接启动进程,这意味着命令元素不会被传递给shell进行预处理。有两种方法可以解决此问题。
- 您可以直接调用 shell 并将命令行作为单个参数传递给它,或者
- 您可以自己完成大部分明显的预处理。
下面是第二个选项的示例。
Seq("sqoop"
,"eval"
,"--connect"
,"jdbc:mysql://localhost:3306/retail_db"
,"--username"
,"root"
,"--password"
,"cloudera"
,"--query"
,"select * from categories").!
如您所见,所有单个参数都显示为单独的参数,包括最后一个参数。