我有一些凌乱的文本回复,我正在尝试清理一下。我正在使用R,并希望匹配所有标点符号的响应以进行删除。
是否有我可以用来匹配这些的正则表达式:
!@#$
.
**********
但不是这些:
Hello.
!asdf
**********1
我以前试过
x[grepl("^[[:punct:]+]", x)]
仅将第一个字符的标点符号与另一个标点符号匹配
只需使用否定即可。
x[!grepl("\w", x)]
或
x[!grepl("[a-zA-Z]", x)]
您的正则表达式x[grepl("^[[:punct:]+]", x)]
应检查开头是否存在标点符号。
^[^\w\n]+$
你可以使用它。请参阅演示。
https://regex101.com/r/cZ0sD2/6