背景信息:
我有一个应用程序,它可以将多个SQL连接到多个数据库,目前执行起来需要很长时间。
Powershell(.NET)将等待每个继续执行的">SQL-GET"函数完成,然后才能启动下一个。我的印象是,我可以通过在自己的后台工作中同时启动每个">SQL-GET"函数来显著加快这个应用程序的速度!然后,我将在每个作业完成时检索它们的数据。理想情况下作为数据集系统对象。
问题:
从后台作业检索数据时,我只能设法取回System.Array对象。我实际追求的是一个System.DataSet对象。这是必要的,因为应用程序中的所有逻辑都依赖于DataSet对象。
代码:
下面是一段v.simple代码,它将创建一个sql连接,并用返回的结果填充新创建的数据集对象。效果不错。$results是一个DataSet对象,我可以很好地处理它。
$query = "SELECT * FROM [database]..[table] WHERE column = '123456'"
$Connection = New-Object System.Data.SqlClient.SQLConnection
$ConnectionString = "Server='SERVER';Database='DATABASE';User ID='SQL_USER';Password='SQL_PASSWORD'"
$Connection.ConnectionString = $ConnectionString
$Connection.Open()
$Command = New-Object system.Data.SqlClient.SqlCommand($Query,$Connection)
$Adapter = New-Object system.Data.SqlClient.SqlDataAdapter
$Adapter.SelectCommand = $Command
$Connection.Close()
[System.Data.SqlClient.SqlConnection]::ClearAllPools()
$results = New-Object system.Data.DataSet
[void]$Adapter.fill($results)
$results.Tables[0]
这是一个新后台作业的脚本块参数中包含的"非常相同的代码"。只有在调用Receive Job时,我才能返回一个数组,而不是数据集。
$test_job = Start-Job -ScriptBlock {
$query = "SELECT * FROM [database]..[table] WHERE column = '123456'"
$Connection = New-Object System.Data.SqlClient.SQLConnection
$ConnectionString = "Server='SERVER';Database='DATABASE';User ID='SQL_USER';Password='SQL_PASSWORD'"
$Connection.ConnectionString = $ConnectionString
$Connection.Open()
$Command = New-Object system.Data.SqlClient.SqlCommand($Query,$Connection)
$Adapter = New-Object system.Data.SqlClient.SqlDataAdapter
$Adapter.SelectCommand = $Command
$Connection.Close()
[System.Data.SqlClient.SqlConnection]::ClearAllPools()
$results = New-Object system.Data.DataSet
[void]$Adapter.fill($results)
return $results.Tables[0]
}
Wait-Job $test_job
$ret_results = Receive-Job $test_job
如有任何帮助,我们将不胜感激!!!
迄今为止的研究:
我用过旧的谷歌,但我偶然发现的所有帖子、博客和文章似乎都深入到了管理工作以及围绕这一点的所有细节。powershell的基本特性是仅通过receive-job cmdlet返回数组吗?
我读过一篇关于return表达式的文章。我以为我找到了什么。尝试:
return $results.Tables[0]
return ,$results.Tables[0]
return ,$results
All仍然返回一个数组。
我见过有人非常笨拙地手动将数组转换回数据集对象——尽管这看起来很"脏"——我很迂腐,希望这个神奇的数据集对象一定有办法穿过后台工作进入我的当前会话!:)
重申:
基本上,我只想让从Receive-Job cmdlet检索到的$ret_results对象成为一个数据集。。。或者甚至是DataTable。我选一个。。。只是不是数组:)
在powershell中,一组任意类型的多个对象在集合中返回是很常见的。考虑一下这个修改后的例子,我在其中构建了自己的表:
PS C:> $job = Start-Job -ScriptBlock {
>>
>> $table = New-Object system.Data.DataTable “MyTable”
>>
>> $col1 = New-Object system.Data.DataColumn MyFirstCol,([string])
>> $col2 = New-Object system.Data.DataColumn MyIntCol,([int])
>>
>> $table.columns.add($col1)
>> $table.columns.add($col2)
>>
>> $row1 = $table.NewRow()
>> $row1.MyFirstCol = "FirstRow"
>> $row1.MyIntCol = 1
>> $row2 = $table.NewRow()
>> $row2.MyFirstCol = "SecondRow"
>> $row2.MyIntCol = 2
>>
>> $table.Rows.Add($row1)
>> $table.Rows.Add($row2)
>>
>> $dataSet = New-Object system.Data.DataSet
>> $dataSet.Tables.Add($table)
>>
>> $dataSet.Tables[0]
>>
>> }
>>
PS C:> $output = Receive-Job -Job $job
收到输出。那么我们得到了什么?
PS C:> $output.GetType()
IsPublic IsSerial Name BaseType
-------- -------- ---- --------
True True Object[] System.Array
一个数组,正如您所描述的。但这就是全部目标。如果我们通过管道将其成员连接到Get-Member
来单独分析其成员,会怎么样?
PS C:> $output | gm
TypeName: Deserialized.System.Data.DataRow
Name MemberType Definition
---- ---------- ----------
ToString Method string ToString(), string ToString(string format, System.IFormatProvider formatProvi...
PSComputerName NoteProperty System.String PSComputerName=localhost
PSShowComputerName NoteProperty System.Boolean PSShowComputerName=False
RunspaceId NoteProperty System.Guid RunspaceId=186c51c3-d3a5-404c-9a4a-8ff3d3a7f024
MyFirstCol Property System.String {get;set;}
MyIntCol Property System.Int32 {get;set;}
PS C:> $output
RunspaceId : 186c51c3-d3a5-404c-9a4a-8ff3d3a7f024
MyFirstCol : FirstRow
MyIntCol : 1
RunspaceId : 186c51c3-d3a5-404c-9a4a-8ff3d3a7f024
MyFirstCol : SecondRow
MyIntCol : 2
考虑以下内容:
在您的工作中,您已指定应返回
$results.Tables[0]
。通过指定一个特定的Tables迭代,您将返回描述该表的对象。。。可能是DataTable,或者在本例中是DataRows。。。而不是您所期望的数据集?DataTables有行。如果DataTable有多行,powershell将在DataRows集合中返回它,正如我在上面演示的那样。您可能会惊讶地发现,单行返回的情况并非如此——它只返回单个DataRow对象,而不是DataRow的集合。
如果这确实是您期望的输出,那么您可能希望通过将输出指定为
@($results.Tables[0])
来强制它始终在集合中返回。通过这种方式,您总是知道需要一个集合,并且可以适当地处理生成的内容(通过遍历集合来管理单个对象)。
当您将脚本作为PS作业运行时,您正在创建一个新进程(pid),并且无法从父作业中真正获得相同的对象。使用receive-Job cmdlet收到的是该对象的反序列化副本(所有属性都将转换为基类型(如字符串/数字等),并且方法将被删除。
但有一个解决方案——运行空间。运行空间是在同一pid内创建的子进程,作为一个单独的线程。它基本上是异步函数(脚本块)执行。检查以下样本:
$script = {
$dt = new-object System.Data.DataTable
$dt.Columns.add() | Out-Null
$dt.Columns.add() | Out-Null
$dt.Rows.Add(1,2) | Out-Null
$dt.Rows.Add(3,4) | Out-Null
$ds = New-Object System.Data.DataSet
$ds.Tables.Add($dt)
Write-Output @{ds = $ds}
}
$PowerShell = [powershell]::Create()
$Runspace = [runspacefactory]::CreateRunspace()
$PowerShell.runspace = $Runspace
$Runspace.Open()
[void]$PowerShell.AddScript($script)
$result = $PowerShell.Invoke()
$result.ds.gettype()
此代码在运行空间中执行$script脚本块。此示例不是异步运行的(需要使用BeginInvoke/EndInvoke,只是为了简单起见跳过了它),但正如您所看到的,它返回的是实际的DataSet/DataTable,而不是PSObject
要了解更多信息,请查看Scripting Guy的以下帖子:https://blogs.technet.microsoft.com/heyscriptingguy/2015/11/26/beginning-use-of-powershell-runspaces-part-1/他还创建了一个PoshRSJob模块——它镜像标准作业cmdlet,但使用Runspace(异步执行)