我无法编译以下代码。我知道它打印的代码部分可能在下面的循环中,但我想理解为什么它没有按照编写方式编译。非常感谢。
csv文件可以从";Minerando Dados";储存库(https://github.com/minerandodados/mdrepo)
import pandas as pd
arquivo = 'kc_house_data.csv'
dataset = pd.read_csv(arquivo, nrows = 7)
chunk = pd.read_csv(arquivo, chunksize = 5000)
for parte in chunk:
print(len(parte))
lista = []
for parte in chunk:
lista.append(parte['floors']*3)
dataset['floors_size'] = pd.concat(lista)
ValueError:没有要连接的对象
问题是chunk
是一个生成器,一旦完成,生成器就会变空
for parte in chunk:
print(len(parte))
最简单的解决方案是删除打印数据帧长度的for循环。然而,一个更快的解决方案是
arquivo = 'kc_house_data.csv'
dataset = pd.read_csv(arquivo, nrows = 7)
chunk = pd.read_csv(arquivo, chunksize = 5000)
dataset['floors_size'] = pd.concat(chunk,ignore_index=True)['floors'] * 3