假设我使用pl.concat()
:从csv文件列表中创建一个polars Lazyframe
df = pl.concat([pl.scan_csv(file) for file in ['file1.csv', 'file2.csv']])
生成的数据帧中的数据是否保证具有输入文件的确切顺序,或者是否存在查询优化器会混淆的情况?
订单得到维护。引擎可能会以不同的顺序执行它们,但最终结果将始终与调用方提供的延迟计算具有相同的顺序。