我有一个数据帧:
Model A C
Neg Exp 3 2
Power Model 2 1
Log 2 7
我想在"模型"列的基础上对这些进行一些计算。
如果Model列包含exp,则执行A+C如果Model列包含pow,则执行A*C如果模型列包含、记录、执行A-C
预期输出
Model A C Result
Neg Exp 3 2 5
Power Model 2 1 2
Log 2 7 -5
尝试使用contains
和np.select
import re
c1 = df.Model.str.contains('exp',flags = re.IGNORECASE)
c2 = df.Model.str.contains('pow',flags = re.IGNORECASE)
c3 = df.Model.str.contains('log',flags = re.IGNORECASE)
df['new'] = np.select([c1,c2,c3], [df.eval('A+C'),df.eval('A*C'),df.eval('A-C')])
df
Out[186]:
Model A C new
0 NegExp 3 2 5
1 PowerModel 2 1 2
2 Log 2 7 -5
使用df.apply(..., axis=1)
函数,可以将整行切换到定义的函数并计算所需的输出。尽管没有其他解决方案那么优雅,但我认为它更具可扩展性。
data = [{"Model":"Neg Exp","A": 3,"C": 2},
{"Model":"Power Model","A": 2,"C": 1},
{"Model":"Log","A": 2,"C": 7}]
import pandas as pd
df = pd.DataFrame(data)
def conditional_apply(row):
if row["Model"].lower().find("exp") >= 0:
return row["A"]+ row["C"]
elif row["Model"].lower().find("pow") >= 0:
return row["A"]* row["C"]
elif row["Model"].lower().find("log") >= 0:
return row["A"]- row["C"]
df["Result"] = df.apply(lambda row: conditional_apply(row), axis=1)
结果:
df
Out[87]:
Model A C Result
0 Neg Exp 3 2 5
1 Power Model 2 1 2
2 Log 2 7 -5
编辑:稍微清理一下conditional_apply
def conditional_apply(row):
model, A, C = row["Model"].lower(), row["A"], row["C"]
if model.find("exp") >= 0:
return A+ C
elif model.find("pow") >= 0:
return A* C
elif model.find("log") >= 0:
return A- C