我是Python的新手。我已经通过熊猫抓取了一个 html 表,我正在寻找插入具有重复字符串值的新列并将其设置为表索引的方法(如下所示:(。提醒一下,桌子很长:)。
原文 df:
Age IQ
12 100
15 111
. .
. .
. .
. .
13 121
预期 df">
Group Age IQ
A 12 100
A 15 111
. . .
. . .
. . .
. . .
A 13 121
使用 assign
创建包含新列的数据帧副本:
df.assign(Group='A')
Age IQ Group
0 12 100 A
1 15 111 A
2 13 121 A
之后可以重新对齐列
df.assign(Group='A')[['Group'] + df.columns.tolist()]
Group Age IQ
0 A 12 100
1 A 15 111
2 A 13 121
但是,您可以使用 insert
就地编辑数据帧。 这还有一个额外的好处,即允许您指定新列的位置。
df.insert(0, 'Group', 'A')
df
Group Age IQ
0 A 12 100
1 A 15 111
2 A 13 121