r语言 - 用不同的标识符对数据框中的观测值进行分类 - r - Categorize observations in dataframe by different identifiers 小贝子编程网

我已经到处寻找解决这个问题的方法，但似乎找不到任何方法。

我已经从丹麦议员使用rtweet包访问Twitter API的推文。我使用get_gimeline()来提取数据。

get_timeline(c(politikere), n = 100,  parse = TRUE, since_id = "1315756184247435264", max_id = "1333904927559725056", type = "recent") %>%
dplyr::filter(created_at > "2020-10-25" & created_at <="2020-12-01")

现在我想根据他们的政党ID对不同的Twitter用户进行分类，以便进行一些政党特定的情感分析。从API调用中，您可以将各种信息放入标题数据框架中，例如"用户id";涵盖了大约90个不同的变量

<表类>user_idstatus_idcreated_atscreen_name文本描述…x_i

好了，我找到解决方案了!在手动创建标识符(称为Parti_id)之后，我使用了tidyverse包并使用了left_join():

poldata <- poldata %>%   
select(screen_name,Parti_id)  
FTtweets <- left_join(tmlpol, poldata, by = "screen_name")

r语言 - 用不同的标识符对数据框中的观测值进行分类

相关内容

最新更新

热门标签：