Regex Pandas in python



我有我的dataframe df['data']的列。

对于此列数据的每一行,我要验证每行的字符串是否包含:

risque de fraude, risques de fraude, risques de frodes, fraud risk, fraud,fraude, frode,fraudes, frodes

如果该线包含以下字符串之一返回1。

我该如何使用Regex?

谢谢

与正则使用pd.Series.str.contains

df['new'] = df['data'].str.lower().str.contains('risque de fraude|risques de fraude|risques de frodes|fraud risk|fraude|frode|fraudes|frodes').astype(int)

现在:

print(df)

将导致具有附加列的数据帧,'new'具有预期的01整数值。

最新更新