"pl.concat([lazyframe1,lazyframe2])"是否严格保留输入数据帧的顺序



假设我使用pl.concat():从csv文件列表中创建一个polars Lazyframe

df = pl.concat([pl.scan_csv(file) for file in ['file1.csv', 'file2.csv']])

生成的数据帧中的数据是否保证具有输入文件的确切顺序,或者是否存在查询优化器会混淆的情况?

订单得到维护。引擎可能会以不同的顺序执行它们,但最终结果将始终与调用方提供的延迟计算具有相同的顺序。

最新更新