熊猫:选择带有[列名][行号]的数组值仅适用于多索引

我尝试使用Pandas在数据透视表的帮助下分析数据。

对于多索引，一切正常。

我有这个数据透视表：

>>>print(pivtab)
count  win
pp   ps              
8000 8200      4    2
8100 8200      2    1
8300      3    1

现在，例如，我可以选择"计数"列中第二行的值

>>>print(pivtab["count"][1])
2

仅使用单个索引数据透视表时会出现意外行为。数据透视表如下所示：

count  win
pp              
8000      4    2
8100      5    2

现在，当我尝试以同样的方式使用print(pivtab["count"][1])我得到一个KeyError: 1.似乎 Python 现在不接受行号，而是接受行名 (=index(。跟

>>>print(pivtab["count“][8100])
5

一切正常。

完整的代码如下所示：

import pandas as pd
columns = ["count","game_Id","season","win","pp","ps"]
matrix = pd.DataFrame(columns=columns)
# Create a test matrix
for i in range(1,10):
win = 0
if int(i/2) == i/2:
win = 1
pprim = 8000
if i > 4:
pprim = 8100
psub = 8200
if i > 6:
psub = 8300
new_row = pd.DataFrame([[1, i, 11, win, pprim, psub]], columns=columns)
matrix = matrix.append(new_row,ignore_index=True)
print(matrix)
pivtab = pd.pivot_table(matrix, index=["pp","ps"], values=["count","win"], aggfunc="sum")
print("n", pivtab)
print(pivtab["count"][1])

为了完全困惑，我尝试了另一个测试矩阵......在这里一切正常！

import pandas as pd
matrix = pd.DataFrame({"A":["hey","hey","boo","boo"], "B":[1,2,3,2], "valueA":[123,441,190,123], "valueB":[5,5,6,6]})
piv_matrix = pd.pivot_table(matrix, index=["A"], values=["valueA","valueB"], aggfunc="sum")
print(piv_matrix)
print("nValue:", piv_matrix["valueA"][1])

结果：

valueA  valueB
A                  
boo     313      12
hey     564      10
Value: 564

如果您能向我解释这种意外(至少对我来说(行为的原因，我将很高兴。谢谢！

不鼓励使用文档

该文档不鼓励使用链式索引。不应使用语法df[label_1][label_2]。

选择

大多数解决方案涉及用于标签/位置切片的loc/iloc，或用于访问标量的at/iat。

在您的示例中，混合了基于标签和基于位置的索引器。相反，您可以选择一个系列并使用iat或iloc：

piv_matrix['valueA'].iat[1]
piv_matrix['valueA'].iloc[1]

此语法适用于您的两个示例。

相关内容

最新更新

热门标签：