我有我的dataframe df['data']
的列。
对于此列数据的每一行,我要验证每行的字符串是否包含:
risque de fraude, risques de fraude, risques de frodes, fraud risk, fraud,fraude, frode,fraudes, frodes
如果该线包含以下字符串之一返回1。
我该如何使用Regex?
谢谢
与正则使用pd.Series.str.contains
:
df['new'] = df['data'].str.lower().str.contains('risque de fraude|risques de fraude|risques de frodes|fraud risk|fraude|frode|fraudes|frodes').astype(int)
现在:
print(df)
将导致具有附加列的数据帧,'new'
具有预期的0
和1
整数值。