我是熊猫新手,所以请帮我解决这个问题。 我从 5 个 csv 文件创建了连接文件,如下所示:
import os
import glob
import pandas as pd
import csv
os.chdir(r"C:Userscsv files")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])
combined_csv.to_csv("combined_csv.csv", index=False, encoding='utf-8-sig')
现在我想使用该文件,但是当我键入一些命令时,例如print(combined_csv.isnull().sum())
程序从头开始,我已经创建的组合csv文件追加两次(我的组合文件由8040个原始文件组成,之后变为16080个原始文件(然后给出所需命令的结果combined_csv.isnull().sum()
。
我知道这是正常的,因为我运行了两次程序,但是有没有办法解决这个问题,不使用file作为命令行参数,也许在代码中写了一些东西? 感谢您的帮助。
如果你想以更交互的方式处理数据(无需一次又一次地重新启动python脚本(,你可以使用ipython
(https://ipython.readthedocs.io/en/stable/interactive/tutorial.html(或更方便的浏览器应用程序jupyter lab
(https://jupyterlab.readthedocs.io/en/stable/(。