正在尝试编写pyspark函数,以便在Apache Spart上使用Databricks连接到SQL Server



我正在尝试编写一个函数,可以用来从Databricks连接到SQL Server。

我的尝试如下:

def readFromDb():
jdbcDF = (spark.read
.format("jdbc")
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option("url", "jdbc:sqlserver://mysqlserver.database.windows.net;database=mydatabase")
.option("user", 'myusername')
.option("query", 'query')
.option("password", 'myquery')
.load()    
)

但我不断地得到错误:

com.microsoft.sqlserver.jdbc.SQLServerException: Incorrect syntax near ')'.
---------------------------------------------------------------------------
Py4JJavaError                             Traceback (most recent call last)
<command-2138842992712231> in <module>
----> 1 readFromDb()
<command-2138842992712230> in readFromDb()
1 def readFromDb():
----> 2          jdbcDF = (spark.read

对这个错误有什么看法吗?

将use和password选项替换为DB的实际值,将query选项替换为要运行的查询。另外,不要忘记在函数末尾添加return。

例如:.option("query", 'select * from information_schema.tables')

最新更新