ADX导出可能的缓冲



我注意到,每当我们发出一个按需导出命令,试图将大量数据导出到指向blob存储的外部表时,很长一段时间(例如20-30分钟)在目的地中什么也没有出现,然后突然在数据开始写入之后。这是否意味着ADX花在"缓冲"上的所有时间?集群不应该在我们提交导出命令后立即开始连续导出数据吗?在最初的长间隔中,当它显然没有导出时,它到底在做什么?

该命令写入磁盘上的临时文件,并在它们达到最大大小或所有数据写入后将它们上传到存储中。上传第一个文件所需的时间可能与外部表定义有关。例如,如果对外部表进行了分区,并且每个分区都相对较小,则在每个文件达到其最大大小(或在命令结束时)之前,它不会将文件上传到存储中。

最新更新