以下是正在发生的事情:
df = pd.read_csv('data')
important_region = df[df.columns.get_loc('A'):df.columns.get_loc('C')]
important_region_arr = important_region.values
print(important_region_arr)
现在,问题来了:
print(important_region.shape)
output: (5,30)
print(important_region_arr.shape)
output: (5,30)
print(important_region)
output: my columns, in the panda way
print(important_region_arr)
output: first 5 rows of the dataframe
索引了列之后,如何转换到numpy数组?
或者,我可以从一开始就转换为numpy,并在numpy中运行切片操作。但是,熊猫是如何做到这一点的呢?
下面是如何用特定列对数据集进行切片的方法。loc
使您可以访问行和列的grup。,
前面的表示后面的行和列。如果指定了:
,则表示所有行。
data.loc[:,'A':'C']
要了解更多信息,请查看文档。