有什么方法可以在我已经创建 concat 文件的同一个 py 文件中工作吗?



我是熊猫新手,所以请帮我解决这个问题。 我从 5 个 csv 文件创建了连接文件,如下所示:

import os
import glob
import pandas as pd
import csv
os.chdir(r"C:Userscsv files")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])
combined_csv.to_csv("combined_csv.csv", index=False, encoding='utf-8-sig')

现在我想使用该文件,但是当我键入一些命令时,例如print(combined_csv.isnull().sum())程序从头开始,我已经创建的组合csv文件追加两次(我的组合文件由8040个原始文件组成,之后变为16080个原始文件(然后给出所需命令的结果combined_csv.isnull().sum()

我知道这是正常的,因为我运行了两次程序,但是有没有办法解决这个问题,不使用file作为命令行参数,也许在代码中写了一些东西? 感谢您的帮助。

如果你想以更交互的方式处理数据(无需一次又一次地重新启动python脚本(,你可以使用ipython(https://ipython.readthedocs.io/en/stable/interactive/tutorial.html(或更方便的浏览器应用程序jupyter lab(https://jupyterlab.readthedocs.io/en/stable/(。

最新更新