所以我目前正在R
中使用coreNLP
包对评论进行情绪分析,这是我使用tuber
包从YouTube收集的。我的评论存储在数据框中,其中每行代表一个评论。对于情绪分析,每个评论都需要以标点符号结尾,以便告诉算法哪些是要分析的各个字符串。有没有一种方便的方法可以在数据框中每一行的末尾添加标点符号?最后只是一个简单的点。
谢谢!
您可以使用paste0
.
例:
states <- c('Texas', 'Texas', 'Arizona', 'California', 'California')
states <- paste0(states, ".")
# "Texas." "Texas." "Arizona." "California." "California."
如果所有注释都在一列数据帧上,那么apply
和paste0
应该可以解决问题。
yourDataWithDot <- data.frame(comments = apply(yourData, 1, function(x) paste0(as.character(x), '.')))
为了建立在Yusuf Syakur的答案的基础上,如果要将粘贴应用于数据框中的所有单元格而不是单个列/向量,则可以简单地执行以下操作:
library(dplyr)
your.df %>% mutate_all(funs(paste(.,".", sep ="")))