在actions列中有以下文本。
"Why don't you clean this table : J$CLAB"
"http("J$MANG.create"): 21/01/06 23:24:05 INFO"
我想提取以J$…开头的单词。直到最后。例:J$MANG &;添加到新列中。
这是我到目前为止所做的,没有按需要工作
file['fileName'] = [re.split(r'[^J$A-Z.$]|[^J$A-Zs$]', val.strip()) for val in file['action']]
file['fileName'] = [' '.join(val) for val in file['fileName']]
任何建议。Thx
可以使用
file['fileName'] = file['action'].str.extract(r'b(J$w*)', expand=False)
查看regex演示
细节:
b
- a字边界(J$w*)
-组1:J
和零个或多个字字符。