我试图通过日期来可视化情绪,日期的格式为天、月、年。
以下是我的数据集中的变量示例:
str(twitter_posts)
结果:
tibble [1,068 × 5] (S3: tbl_df/tbl/data.frame)
$ post : chr [1:1068] "السلام عليكم ورحمة الله وبركاتةrnياليت المشرفات يثبتوه لنا عشان يكون مرجع للأخبار الجديدةrnعن الزيادة مو كل"| __truncated__ "والله انك صادقه والدليل محد رد على موضوعكrnrnخوافات بجد؟؟rnrnسمعت عندنا بمدرستنا انهم بيرفعون الراتب عل"| __truncated__ "الله المستعان حتى ماتبغوا نفيد بعضناrnشوفوا التجمعات الثانية كيفrnمن جد مالنا كلمة مسموعة" "وتعاونوا على البر والتقوى" ...
$ date : chr [1:1068] "40643" "40643" "40673" "40673" ...
$ period : chr [1:1068] "10-Apr-11" "10-Apr-11" "10-May-11" "10-May-11" ...
$ sentiment : chr [1:1068] "neutral" "negative" "negative" "positive" ...
$ treatment_announcement: chr [1:1068] "pre" "pre" "pre" "pre" ...
我正在尝试运行以下代码,并使用了下面推荐的代码
twitter_posts %>%
mutate(date = as.Date(as.numeric(date), origin = "1899-12-30")) %>%
mutate(date = as.Date(period))%>%
count(sentiment, date)%>%
ggplot(aes(x = date, y = n, fill = sentiment))+
geom_col() +
#geom_col(position = "dodge")+
scale_fill_manual(values = c("positive" = "green",
"negative" = "red",
"neutral"= "black"))+
scale_x_date(date_labels = "%b-%y")+
#facet_wrap(~ year(date))
theme_classic()
但我仍然收到一个关于时间变量的错误:
"错误:mutate()
列date
出现问题。ℹdate = as.Date(period)
。x字符串不是标准的明确格式。运行rlang::last_error()
查看错误发生的位置">
试试这个:
twitter_posts %>%
mutate(date = as.Date(as.numeric(date), origin = "1899-12-30")) %>%
#updated
mutate(period = parse_date_time(period, "dmy") %>%
#mutate(date = as.Date(period))%>%
count(sentiment, date)%>%
ggplot(aes(x = date, y = n, fill = sentiment))+
geom_col() +
#geom_col(position = "dodge")+
scale_fill_manual(values = c("positive" = "green",
"negative" = "red",
"neutral"= "black"))+
scale_x_date(date_labels = "%b-%y")+
#facet_wrap(~ year(date))
theme_classic()