熊猫:沿着特定列切片后,获取"values"而不返回整个数据帧



以下是正在发生的事情:

df = pd.read_csv('data')
important_region = df[df.columns.get_loc('A'):df.columns.get_loc('C')]
important_region_arr = important_region.values
print(important_region_arr)

现在,问题来了:

print(important_region.shape)
output: (5,30)
print(important_region_arr.shape)
output: (5,30)
print(important_region)
output: my columns, in the panda way
print(important_region_arr)
output: first 5 rows of the dataframe

索引了列之后,如何转换到numpy数组?

或者,我可以从一开始就转换为numpy,并在numpy中运行切片操作。但是,熊猫是如何做到这一点的呢?

下面是如何用特定列对数据集进行切片的方法。loc使您可以访问行和列的grup。,前面的表示后面的行和列。如果指定了:,则表示所有行。

data.loc[:,'A':'C']

要了解更多信息,请查看文档。

相关内容

最新更新