我需要一个函数来检查熊猫 df 列中的字符串值,但找不到答案



我用另外两个部分做了一个熊猫df: 这是我想做的伪代码。 4 列熊猫数据帧,所有列中的值均为单字列 A B C D 我想要这个: cols A B C D E F 在别名中(对于 A 中的每个 s;如果 s == D 中的任何字符串(不是子字符串(;将 Yes 写到 E(新列(否则将 No 写到 E;如果 B 中的 str(与 s 相同的行(== C 中的 str(与 D 中找到的字符串相同行(将 yes 写到 F(新列(:否则将 No 写为 F( 以下代码有效,但现在我需要一个函数来执行上述操作:

我不允许粘贴示例数据和预期结果的图像。

cols = [1,2,3,5]
df3.drop(df3.columns[cols],axis=1, inplace=True)
df4.drop(df4.columns[1],axis=1, inplace=True)
listi = [df4]
listi.append(df3)
df5 = pd.concat(listi, axis = 1)

希望这有帮助

我创建了一个示例数据框

>>> df
A          B        C          D
0  alpha  spiderman    theta   superman
1   beta     batman    alpha  spiderman
2  gamma   superman  epsilon       hulk

现在添加显示A中的项目是否在C中的column E,并添加显示B中的项目是否在Dcolumn F

>>> df['E'] = df.A.isin(df.C).replace({True: "Yes", False: "No"})
>>> df['F'] = df.B.isin(df.D).replace({True: "Yes", False: "No"})
>>> df
A          B        C          D    E    F
0  alpha  spiderman    theta   superman  Yes  Yes
1   beta     batman    alpha  spiderman   No   No
2  gamma   superman  epsilon       hulk   No  Yes

最新更新