我有一个看起来像这样的数据集:
ID | URL |
---|---|
1 | 示例。ae/ru/page2 |
2 | 示例。rubin.com |
3 | NaN |
4 | 示例ru/example |
您可以匹配/
.
或-
,然后是ru
和单词边界
[/.-]rub
例如:
df['ru'] = df.apply(lambda row: 1 if re.search(r'[/.-]rub', row['URL']) else 0 , axis=1)