我不太擅长R,但我正在尝试为回归分析准备数据。所以我有三个数据帧,我正试图在第一个数据帧中添加一列。
从本质上讲,我的数据是:
City Neighborhood X Y Z
Euclid N/A
Cleveland Glenville
Mayfield Heights N/A
Euclid N/A
Euclid N/A
Cleveland Clark-Fulton
我想添加一个标题为:PercentSpanistic的列(数据帧中的位置无关紧要(。
我的第二个数据帧看起来像:
City PercentHispanic
Euclid X%
Cleveland Y%
Mayfield Z%
对于克利夫兰市,我的数据帧看起来像:
Neighborhood PercentHispanic
Glenville X%
Clark-Fulton Y%
Downtown Z%
如何添加"百分比西班牙裔"列?我希望数据帧基于城市合并,除非城市是克利夫兰,否则我希望它基于邻里合并。我不想去掉N/A值(我想保留所有行(。
谢谢!
我们可以进行两次连接
library(dplyr)
out <- left_join(df1, df2, by = 'City') %>%
left_join(df3, by = 'Neighborhood')