我正在将Excel文件导入R中,其中Excel中的日期格式为"2012年2月27日";。然而,一旦我用下面的代码将数据集导入R中:
#Loading packages
library(tidyverse)
library(readxl)
library(writexl)
library(stringr)
library(textclean)
library(lubridate)
library(zoo)
导入数据
data_corpus <- read_excel("data.xlsx",
sheet= "xyz")
某些行中的日期格式保持为"0";27-02-2012";,而其它行看起来如下";40911";。
是否可以将";日期";列,以具有以下格式:"2012年2月27日";?
这是一个数据示例:
sapply(data_corpus, class)
输出:
post date
"character" "character"
我尝试过以下代码,但它将所有值转换为"0";日期";进入NA:
data_corpus$date <- as_date(data_corpus$date)
样品:
data_corpus$post[2]
[1] this is really unfortunateا"
> data_corpus$date[2]
[1] "27-02-2012"
尝试使用col_types
参数
data_corpus <- read_excel("data.xlsx", sheet= "xyz", col_types = c("text", "date"))