如何从UCI ML Repo导入python (pandas)中的csv的整个文件夹?



这是我想要的csv文件的链接:http://archive.ics.uci.edu/ml/datasets/selfBACK

我现在的方法是在本地下载,只需点击它。但是,这个文件夹有很多不同的文件夹,里面有很多csv。我如何有效地导入它?

我知道如何一步一步地做,但我觉得必须有更有效的方法。

您可以首先读取该文件夹中的所有路径,并过滤csv文件(或添加其他过滤器,例如针对特定文件名)。在合并文件之后,如果数据以相同的方式是表格和结构化的,则在这里使用pandas。

import os
import pandas as pd
path = 'your_folder_path'
dfs = [pd.read_csv(f) for f in os.listdir(path) if f.endswith('.csv')]
# combine them (if they have the same format) like this:
df = pd.concat(dfs)

注意:你也可以创建一个字典(key=filename, value=dataframe),然后使用文件名访问数据。

最新更新