如何在 R 中的数据框中每行的末尾添加标点符号



所以我目前正在R中使用coreNLP包对评论进行情绪分析,这是我使用tuber包从YouTube收集的。我的评论存储在数据框中,其中每行代表一个评论。对于情绪分析,每个评论都需要以标点符号结尾,以便告诉算法哪些是要分析的各个字符串。有没有一种方便的方法可以在数据框中每一行的末尾添加标点符号?最后只是一个简单的点。

谢谢!

您可以使用paste0.

例:

states <- c('Texas', 'Texas', 'Arizona', 'California', 'California')
states <- paste0(states, ".")
# "Texas."      "Texas."      "Arizona."    "California." "California."

如果所有注释都在一列数据帧上,那么applypaste0应该可以解决问题。

yourDataWithDot <- data.frame(comments = apply(yourData, 1, function(x) paste0(as.character(x), '.')))

为了建立在Yusuf Syakur的答案的基础上,如果要将粘贴应用于数据框中的所有单元格而不是单个列/向量,则可以简单地执行以下操作:

library(dplyr)
your.df %>% mutate_all(funs(paste(.,".", sep ="")))

最新更新