将表格中的panda DataFrame转换为嵌套的panda数据帧



假设我有一个简单的pd.DataFrame,如下所示:


d = {'col1': [1, 20], 'col2': [3, 40], 'col3': [5, 50]}
df = pd.DataFrame(data=d)

df
col1  col2  col4
0     1     3     5
1    20    40    60

有没有一种方法可以将其转换为脏熊猫数据帧(df_new(,比如当我调用df_new.values[0]时,将其作为ouptut:

array(
[0    1
1    3
2    5
Length: 3, dtype: int], dtype=object)

我仍然不明白确切的要求,但这里有一些东西:

获得所需output的一种方法是:

>>> pd.Series(df.T[0].values)
0    1
1    3
2    5
dtype: int64

如果你想把这些作为2d阵列:

>>> np.array(pd.DataFrame(df.T[0].values).reset_index())
array([[0, 1],
[1, 3],
[2, 5]])
>>> np.array(pd.DataFrame(df.T[1].values).reset_index())
array([[ 0, 20],
[ 1, 40],
[ 2, 50]])

最新更新