使用lambda (pd.DataFrame)进行元素操作



尝试使用lambda从DatraFrame中减去常量数组。

这是我的数据框架d:

import pandas as pd
d = pd.DataFrame()
d['x'] = pd.Series([1, 2, 3, 4, 5, 6])
d['y'] = pd.Series([11, 22, 33, 44, 55, 66])

按预期工作的经典循环方法:

transformed = pd.DataFrame(columns=('x', 'y'))
for index, row in d.iterrows():
transformed.loc[index] = [row[0] + 5, row[1] + 10]
print(transformed)

生产:

x   y
0   6  21
1   7  32
2   8  43
3   9  54
4  10  65
5  11  76

这是lambda版本:

print(d.apply(lambda x: x + [5, 10]))

然而,正在抛出错误:ValueError: operands could not be broadcast together with shapes (6,) (2,)

在阅读了Pandas文档之后,我明白我的lambda方法应该可以工作。为什么它不起作用?

如果列数与列表长度相同,则最简单的是:

print(d + [5, 10])
x   y
0   6  21
1   7  32
2   8  43
3   9  54
4  10  65
5  11  76

如果有多个列由列表选择,列表的长度必须相同:

print(d[['x','y']] + [5, 10])

apply自动按列显示,axis参数默认设置为0。

您需要指定axis=1,因为它将逐行计算:

>>> d.apply(lambda x: x + [5, 10], axis=1)
x   y
0   6  21
1   7  32
2   8  43
3   9  54
4  10  65
5  11  76
>>> 

但是在这种情况下你不需要apply:

>>> d + [5, 10]
x   y
0   6  21
1   7  32
2   8  43
3   9  54
4  10  65
5  11  76
>>> 

相关内容

  • 没有找到相关文章