我有一列网址,需要确定哪个包含"ru"(意思是俄罗斯网站)。但是我的蟒蛇正则表达式不起作用



我有一个看起来像这样的数据集:

ID URL
1 示例。ae/ru/page2
2 示例。rubin.com
3 NaN
4 示例ru/example

您可以匹配/.-,然后是ru和单词边界

[/.-]rub

例如:

df['ru'] = df.apply(lambda row: 1 if re.search(r'[/.-]rub', row['URL']) else 0 , axis=1)

最新更新