Chunksize和concat的问题.ValueError:没有要连接的对象



我无法编译以下代码。我知道它打印的代码部分可能在下面的循环中,但我想理解为什么它没有按照编写方式编译。非常感谢。

csv文件可以从";Minerando Dados";储存库(https://github.com/minerandodados/mdrepo)

import pandas as pd
arquivo = 'kc_house_data.csv'
dataset = pd.read_csv(arquivo, nrows = 7)
chunk = pd.read_csv(arquivo, chunksize = 5000)
for parte in chunk:
print(len(parte))
lista = []
for parte in chunk:
lista.append(parte['floors']*3)

dataset['floors_size'] = pd.concat(lista)

ValueError:没有要连接的对象

问题是chunk是一个生成器,一旦完成,生成器就会变空

for parte in chunk:
print(len(parte))

最简单的解决方案是删除打印数据帧长度的for循环。然而,一个更快的解决方案是

arquivo = 'kc_house_data.csv'
dataset = pd.read_csv(arquivo, nrows = 7)
chunk = pd.read_csv(arquivo, chunksize = 5000)
dataset['floors_size'] = pd.concat(chunk,ignore_index=True)['floors'] * 3