芯片列表"productWords"看起来是这样的:"Natural Chip SeaSalt175g"CCs Nacho奶酪175g">
"Smiths Crinkle Chips Chicken 170g"Smiths Chip Thinly S/Cream&洋葱175g";
我希望删除数字和特殊字符,所以我使用productWords$Chip <- str_replace_all(productWords$Chip,"[:digit:]", "")
以及str_replace_all(productWords$Chip, "[[:punct:]]", " ")
但我想要去除的不仅仅是数字;175g";。
使用sub
,您可以搜索模式并替换它(或通过用空字符串替换它来删除它(。你的例子中的模式是";[0-9]+g";。这对应于任何数字一次或多次,后跟字符g
。
productWords$Chip <- sub(pattern = "([0-9]+g)|[[:punct:]]", replacement = "", x = productWords$Chip)