将每个提取的注释分配给单行写入.表R数据框架



首先,我是一个编码菜鸟,只是为了在我的大学写我的硕士论文而开始编码。我使用R中的块茎软件包提取了YouTube评论,以对这些评论进行情感分析。一切都很好,我收到了一个带有所有注释的数据框(11314观察和13个变量)。但是,当我尝试编写该数据框架的.CSV文件以查看Excel中的评论时,我遇到了一个特定的问题。对于包含新段落的注释,write.table函数创建了一个新行。我使用以下功能:

write.table(testneuohneduplikate, file = "Testneuohnedulikate.csv",sep = ";", row.names = FALSE, col.names = TRUE, quote = TRUE)

是否有可能将每个评论写成一行,有时不是两个或三行,因为该注释包含段落?

我希望我能够正确解释我的问题。

谢谢大家,从德国到您来自哪里的问候:)

是的,write.table遇到新行时正在创建新行。这是从注释字符串中删除新线字符的一个示例:

> comment<-"I think this video n is great"
> cat(comment)
I think this video 
 is great
> fixedcomment<-gsub("[rn]", "", comment)
> cat(fixedcomment)
I think this video  is great
> 

您可以使用"应用"将其应用于表中的每一列,或者如果您只想执行行或列,则修改保证金参数。

> ID<-1:4
> Names<-c('name1','name2','name3','name4')
> Comments<-c("I think this video n is great", "No it stinks n I mean it", "Use the Force", "It's time n to get to work")
> table<-cbind(ID, Names, Comments)
> fixed_table<-apply(X=table,MARGIN=c(1,2),FUN = function(y) gsub("[rn]","",y))

最新更新