用pandas在python中加载多个数据集



我想有一个唯一的数据集,就像一个单一的。csv文件与我所有的数据在它。

问题:整个数据集被分成22个文件夹,每个用户一个文件夹(见下图),然后,每个用户有7个.csv文件,对应于每个用户的统计数据。

我想合并所有这些数据集都在一个,可能与索引,表明用户(为行)。图片如下:

https://i.stack.imgur.com/uX0dc.png

每个用户:

https://i.stack.imgur.com/xZazG.png

我试图在下面写一个想法的代码;我想为所有用户插入a,用"DataPaper/user_i.sleep.csv"改变路径,我不知道怎么做,因为我不掌握python。还要添加其他功能,而不仅仅是"sleep.cvs">

https://i.stack.imgur.com/r315i.png

如果我理解的话,您正在尝试读取多个dataframe并连接。但是你要避免写同样的句子。这不是完全的解决方案,但你可以这样做:

#this create a list of users
userList = [f"user_{i}" for i in range(1,22)] 
#read all df
dfList = []
for user in userList:
thisDF = pd.read_csv(f"DataPaper/{user}/sleep.csv")
dfList.append(thisDF)

result = pd.concat(dfList,keys = userList)

如果这不能正常工作,让我知道!!干杯!

最新更新