从azure数据块中删除azure sql数据库行

我在Azure SQL数据库中有一个表，我想根据某些条件从中删除选定的行，或者从Azure Databricks中删除整个表。目前，我正在使用JDBC的truncate属性来截断整个表而不删除它，然后用新的数据帧重写它。

df.write 
.option('user', jdbcUsername) 
.option('password', jdbcPassword) 
.jdbc('<connection_string>', '<table_name>', mode = 'overwrite', properties = {'truncate' : 'true'} )

但我不想每次都截断和覆盖整个表，而是使用delete命令。我也无法使用下推查询实现这一点。如有任何帮助，我们将不胜感激。

您也可以降到scala来执行此操作，因为SQL Server JDBC驱动程序已经安装。例如：

%scala
import java.util.Properties
import java.sql.DriverManager
val jdbcUsername = "xxxxx"
val jdbcPassword = "xxxxxx"
val driverClass = "com.microsoft.sqlserver.jdbc.SQLServerDriver"
// Create the JDBC URL without passing in the user and password parameters.
val jdbcUrl = s"jdbc:sqlserver://xxxxxx.database.windows.net:1433;database=AdventureWorks;encrypt=true;trustServerCertificate=false;hostNameInCertificate=*.database.windows.net;loginTimeout=30;"
// Create a Properties() object to hold the parameters.
val connectionProperties = new Properties()
connectionProperties.put("user", s"${jdbcUsername}")
connectionProperties.put("password", s"${jdbcPassword}")
connectionProperties.setProperty("Driver", driverClass)
val connection = DriverManager.getConnection(jdbcUrl, jdbcUsername, jdbcPassword)
val stmt = connection.createStatement()
val sql = "delete from sometable where someColumn > 4"
stmt.execute(sql)
connection.close()

使用pyodbc执行SQL语句。

import pyodbc
conn = pyodbc.connect( 'DRIVER={ODBC Driver 17 for SQL Server};'
'SERVER=mydatabe.database.azure.net;'
'DATABASE=AdventureWorks;UID=jonnyFast;'
'PWD=MyPassword')
conn.execute('DELETE TableBlah WHERE 1=2')

让pyodbc在Databricks上工作有点痛苦-请参阅此处的详细信息：https://datathirst.net/blog/2018/10/12/executing-sql-server-stored-procedures-on-databricks-pyspark

相关内容

最新更新

热门标签：