使用列表和pcollection之间的区别



我在apachebeam中构建了一个管道,我只是对此感到好奇,将ptransform应用于列表和pcollection之间有什么区别,性能是否受到此影响,或者只是pcollection不可计算,这是用apachebeam处理管道的坏方法吗?

根据定义,PCollection是一个无界集合。不可变,且无边界

列表的主要区别主要是无边界特性,当您流式传输数据(来自大文件或来自无边界源,如PubSub(时,它尤其强大。

最新更新