我有一个包含四条记录的数据帧:
Name: Bob
College Name:Boston
Name:Ready
College Name:IIT KGP
我想用一个在python中具有两列的表将其转换为形式,例如:
Name College
Boob Boston
Ready IIT
分隔符应为 ":"。
列的前split
个值按前:
,按cumcount
添加计数器,按unstack
重新形状:
df = df['col'].str.split(':', expand=True, n=1)
df.columns = ['a','b']
df1 = (df.set_index(['a',df.groupby('a').cumcount()])['b']
.unstack()
.T
.rename_axis(None, axis=1)
.reindex(columns=df['a'].unique()))
print (df1)
Name College Name
0 Bob Boston
1 Ready IIT KGP