有什么方法可以在我已经创建 concat 文件的同一个 py 文件中工作吗?

我是熊猫新手，所以请帮我解决这个问题。我从 5 个 csv 文件创建了连接文件，如下所示：

import os
import glob
import pandas as pd
import csv
os.chdir(r"C:Userscsv files")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])
combined_csv.to_csv("combined_csv.csv", index=False, encoding='utf-8-sig')

现在我想使用该文件，但是当我键入一些命令时，例如print(combined_csv.isnull().sum())程序从头开始，我已经创建的组合csv文件追加两次(我的组合文件由8040个原始文件组成，之后变为16080个原始文件(然后给出所需命令的结果combined_csv.isnull().sum()。

我知道这是正常的，因为我运行了两次程序，但是有没有办法解决这个问题，不使用file作为命令行参数，也许在代码中写了一些东西？感谢您的帮助。

如果你想以更交互的方式处理数据(无需一次又一次地重新启动python脚本(，你可以使用ipython(https://ipython.readthedocs.io/en/stable/interactive/tutorial.html(或更方便的浏览器应用程序jupyter lab(https://jupyterlab.readthedocs.io/en/stable/(。

相关内容

最新更新

热门标签：