正在尝试编写pyspark函数，以便在Apache Spart上使用Databricks连接到SQL Server

我正在尝试编写一个函数，可以用来从Databricks连接到SQL Server。

我的尝试如下：

def readFromDb():
jdbcDF = (spark.read
.format("jdbc")
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option("url", "jdbc:sqlserver://mysqlserver.database.windows.net;database=mydatabase")
.option("user", 'myusername')
.option("query", 'query')
.option("password", 'myquery')
.load()    
)

但我不断地得到错误：

com.microsoft.sqlserver.jdbc.SQLServerException: Incorrect syntax near &#39;)&#39;.
---------------------------------------------------------------------------
Py4JJavaError                             Traceback (most recent call last)
<command-2138842992712231> in <module>
----> 1 readFromDb()
<command-2138842992712230> in readFromDb()
1 def readFromDb():
----> 2          jdbcDF = (spark.read

对这个错误有什么看法吗？

将use和password选项替换为DB的实际值，将query选项替换为要运行的查询。另外，不要忘记在函数末尾添加return。

例如：.option("query", 'select * from information_schema.tables')

相关内容

最新更新

热门标签：