从字符串中提取单词.非规则模式



我想试着把数字和单词分开。有人能帮我吗?试着使用word()和其他功能,但不起作用。看到有人使用正则表达式提取非正则模式。怎样

order_status_id.status
1              1tMenunggu Pengesahan Peniaga
2                         2tPesanan diterima
3                          3tPesanan ditolak
4                       4tPesanan dibatalkan
5                5tPesanan sedang disediakan
6     6tPesanan sudah siap dan boleh diambil
7  7tPesanan sudah siap dan dalam perjalanan
8              8tSahkan kod kepada pelanggan
9                  9tMenunggu pengesahan kod
10                       10tMenunggu bayaran
11                      11tTransaksi selesai

我尝试了word()函数、str_extractgsub(".*?([c(a-z,A-Z]+).*", "\1",x),但它只分离了第一个单词。

我想你需要这个:

library(dplyr)
df %>% 
mutate(order_status_id.status = gsub("[0-9\t]", "",order_status_id.status))

输出:

order_status_id.status                 
<chr>                                  
1 Menunggu Pengesahan Peniaga            
2 Pesanan diterima                       
3 Pesanan ditolak                        
4 Pesanan dibatalkan                     
5 Pesanan sedang disediakan              
6 Pesanan sudah siap dan boleh diambil   
7 Pesanan sudah siap dan dalam perjalanan
8 Sahkan kod kepada pelanggan            
9 Menunggu pengesahan kod                
10 Menunggu bayaran                       
11 Transaksi selesai   

数据:

df <- structure(list(order_status_id.status = c("1tMenunggu Pengesahan Peniaga", 
"2tPesanan diterima", "3tPesanan ditolak", "4tPesanan dibatalkan", 
"5tPesanan sedang disediakan", "6tPesanan sudah siap dan boleh diambil", 
"7tPesanan sudah siap dan dalam perjalanan", "8tSahkan kod kepada pelanggan", 
"9tMenunggu pengesahan kod", "10tMenunggu bayaran", "11tTransaksi selesai"
)), row.names = c(NA, -11L), class = c("tbl_df", "tbl", "data.frame"
))

最新更新