r语言 - 用不同的标识符对数据框中的观测值进行分类



我已经到处寻找解决这个问题的方法,但似乎找不到任何方法。

我已经从丹麦议员使用rtweet包访问Twitter API的推文。我使用get_gimeline()来提取数据。

get_timeline(c(politikere), n = 100,  parse = TRUE, since_id = "1315756184247435264", max_id = "1333904927559725056", type = "recent") %>%
dplyr::filter(created_at > "2020-10-25" & created_at <="2020-12-01")  

现在我想根据他们的政党ID对不同的Twitter用户进行分类,以便进行一些政党特定的情感分析。从API调用中,您可以将各种信息放入标题数据框架中,例如"用户id";涵盖了大约90个不同的变量

<表类>user_idstatus_idcreated_atscreen_name文本描述…x_i

好了,我找到解决方案了!在手动创建标识符(称为Parti_id)之后,我使用了tidyverse包并使用了left_join():

poldata <- poldata %>%   
select(screen_name,Parti_id)  
FTtweets <- left_join(tmlpol, poldata, by = "screen_name")

最新更新