tidyverse具有神话般的readr,它具有各种各样的解析命令,例如 parse_date
, parse_*
, parse_factor
和 guess_parser
。我在罗马数字方面具有下面的自定义month-year
格式,例如
> emptyOffices$Month
[1] " II/90" " I/91" " II/91" " I/92" " II/92" " I/93" " II/93"
> guess_parser(emptyOffices$Month)
[1] "character"
I
在一月代表的地方,II
代表2月,所以不。例如,II/90
代表February 1990
。guess_parser
猜测一个月错误的含义错误。也许有一个工具可以定义几个月以帮助解析器理解这一点?
是否存在某些整理软件包中的某些工具,以读取自定义日期,例如使用罗马数字?
必须有更好的整理解决方案,但这有效:
library(dplyr)
foo <- c("II/90", "I/91", "II/91", "I/92", "II/92", "I/93", "II/93")
foo %>%
tibble() %>%
mutate(year = gsub(".*/", "", .),
monthRom = as.roman(gsub("/.*", "", .))) %>%
mutate(monthNum = as.numeric(monthRom)) %>%
mutate(monthChr = month.abb[monthNum])
# A tibble: 7 x 5
. year monthRom monthNum monthChr
<chr> <chr> <chr> <dbl> <chr>
1 II/90 90 II 2 Feb
2 I/91 91 I 1 Jan
3 II/91 91 II 2 Feb
4 I/92 92 I 1 Jan
5 II/92 92 II 2 Feb
6 I/93 93 I 1 Jan
7 II/93 93 II 2 Feb
,也可以简单地执行此操作:
foo %>%
gsub("/.*", "", .) %>%
as.roman() %>%
as.numeric() %>%
month.abb[.]
使用utils
的as.roman
将对象转换为roman
类,将此对象转换为数字字符串,然后从base
month.abb
提取月份。