为什么我丢失信息与.str.split(expand=True)?



我正在尝试扩展由字符串组成的数据框架的列,如下所示:

ATTGG
CATGC
GTGCC

在一个新的数据框架中分成几列。

我使用的命令是
newdf = pd.DataFrame(df['col'].str.split("", expand = True)

打印时,我发现第一列和第一行实际上是索引:

0 1 2 3 4 5
1 C A T G C
2 G T G C C

第一行被截断,可能是因为存在索引。

为什么第一行被截断了?我能做些什么来解决这个问题?

在创建数据框架之前将字符串转换为列表:

newdf = pd.DataFrame.from_records(df['col'].map(list))
print(newdf)
# Output
0  1  2  3  4
0  A  T  T  G  G
1  C  A  T  G  C
2  G  T  G  C  C

相关内容

最新更新