我正在尝试用'\'拆分数据框列名称。我的数据如下所示。
AB | XY | CD|
____________________
0 | 1 | 1 |
如何通过拆分列名来实现以下数据帧。
A |B |X |Y |C |D
___________________________________________
0 |0 |1 |1 |1 |1
我正在使用熊猫库进行数据预处理
拆分列以确定需要重复这些值的次数,然后构造DataFrame
print(df)
AB XY CD GHJ
0 0 1 1 2
1 1 17 19 145
s = df.columns.str.split('\')
pd.DataFrame(df.to_numpy().repeat(s.str.len(), axis=1),
columns = [x for y in s for x in y])
输出:
A B X Y C D G H J
0 0 0 1 1 1 1 2 2 2
1 1 1 17 17 19 19 145 145 145