我正在尝试扩展由字符串组成的数据框架的列,如下所示:
ATTGG
CATGC
GTGCC
在一个新的数据框架中分成几列。
我使用的命令是newdf = pd.DataFrame(df['col'].str.split("", expand = True)
打印时,我发现第一列和第一行实际上是索引:
0 1 2 3 4 5
1 C A T G C
2 G T G C C
和第一行被截断,可能是因为存在索引。
为什么第一行被截断了?我能做些什么来解决这个问题?
在创建数据框架之前将字符串转换为列表:
newdf = pd.DataFrame.from_records(df['col'].map(list))
print(newdf)
# Output
0 1 2 3 4
0 A T T G G
1 C A T G C
2 G T G C C