r-比较expss表中的两个变量(均为数字或两个因子)



我正在越来越深入地研究expss包,并面对这里提到的一个示例-->https://gdemin.github.io/expss/#example_of_data_processing_with_multiple-response_variables(尤其是部分的最后一个表

考虑以下数据帧:

vecA <- factor(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)),levels=c(1,2,3,4,5))
vecB <- factor(c(rep(1,20),rep(2,20),rep(NA,10)),levels=c(1,2,3,4,5))
df_fact <- data.frame(vecA, vecB)
vecA_num <- as.numeric(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)))
vecB_num <- as.numeric(c(rep(1,20),rep(2,20),rep(NA,10)))
df_num <- data.frame(vecA, vecB)

严格复制建议的代码(上面的URL(,下面是我的表:

df_fact %>%
tab_cols(total(label = "#Total| |")) %>% 
tab_cells(list(vecA)) %>%
tab_stat_cpct(label="vecA", total_row_position="above", total_statistic="u_cases") %>%
tab_cells(list(vecB)) %>% 
tab_stat_cpct(label="vecB", total_row_position="above", total_statistic="u_cases") %>%
tab_pivot(stat_position = "inside_columns") %>%  
recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy)

与数字示例略有不同的过程:

df_num %>%
tab_cols(total(label = "#Total| |")) %>% 
tab_cells(vecA_num, vecB_num) %>%
tab_stat_valid_n(label = "Valid N") %>%
tab_stat_mean(label="Mean") %>%
tab_pivot(stat_position = "inside_columns") %>%  
recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy) %>%
tab_transpose()

问题从这里开始,因为这些复杂的构造。。。复杂的

1( 我想包括tab_lastrongig*函数族,但我不知道如何做到这一点(当变量是因子时,可能还有小计/净值(

2( 包括多个统计数据(案例、百分比、平均值…(是面临的挑战

3( 最后,我不清楚我应该在哪里写统计名称/变量名称

我还没有找到这些构造的详细文档,因此瓶子里有这样的消息:(

  1. 很遗憾,但到目前为止,显著性测试只支持独立样本。在您的示例中,您希望比较相关样本的统计信息。您可以为独立比例运行显著性计算,但结果将不准确
  2. 包含多个统计信息并不困难——您只需要按顺序写入tab_stat_。但复杂的表格布局确实是一个挑战:(
  3. 统计信息的变量名称应始终写入tab_cells中。之后,您可以使用tab_stat_meantab_stat_cpct等编写统计函数。您可以在R控制台中打印?tab_pivot来查找文档。这是获取R函数的手册的标准方法

相关内容

  • 没有找到相关文章

最新更新