我想在R中按年计算相关系数,并将结果放入数据框架中(然后通过计算决定系数重复该过程)。下面的代码返回一个值,我猜,是所有年份的总和。该值出现在控制台中,但不出现在数据框中。
xmasCount_Amt_Coef_Correlation <- xmasCount_Amt_df_ByCheckDate %>%
group_by(Year.x, YTD_Range.x)
cor(xmasCount_Amt_df_ByCheckDate$n, xmasCount_Amt_df_ByCheckDate$Amount)
源表xmasCount_Amt_df_ByCheckDate的示例屏幕截图如下所示。完整的表(数据框)包含2020-2022年的数据。所需的输出表看起来与源表相同,这不是我想要的。我显然少了一两个步骤,但我不知道是什么。如有任何建议,不胜感激。
源表xmasCount_Amt_df_ByCheckDate
你可以根据需要修改,下面的代码在你的项目,让我知道你得到什么:
library(dplyr)
# Group by year, then calculate corr coeff for each group
xmasCount_Amt_Coef_Correlation <- xmasCount_Amt_df_ByCheckDate %>%
group_by(Year.x) %>%
summarise(correlation = cor(n, Amount))
# and the result:
xmasCount_Amt_Coef_Correlation
一种方法是(决定系数用R^2表示):
# add a new column with the coefficient of determination
xmasCount_Amt_Coef_Correlation <- xmasCount_Amt_Coef_Correlation %>%
mutate(determination = correlation^2)
# View the resulting data frame
xmasCount_Amt_Coef_Correlation