错误:对于SPSS到R的转换,"标签"必须是唯一的



我下载了以下文件(DS43纽约选举申报表,1885-1906(:https://www.icpsr.umich.edu/web/ICPSR/studies/1/datadocumentation#

我试着用R:打开它

data <- "00001-0042-Data.txt"
data_setup <- "00001-0042-Setup.sps"
data <- asciiSetupReader::read_ascii_setup(
data = data,
setup_file = data_setup)

但我在R中得到了以下错误:

Error: `labels` must be unique

我试着看";变量标签";在SPS文件中列出,方法是将其粘贴到Excel中,用空格分隔,并以这种方式识别重复项。到目前为止,我能够识别出五个重复:

  • 858 3 G CONG 0100投票
  • 870 3 G刚果0200票
  • 874 3 G聪0100票
  • 878 3 G CONG 0320票
  • 878 3 S聪0320票

我把1放在变量的第二个实例旁边(稍后我会在检查变量是否实际相同时删除它(,但我仍然得到"0";错误:labels必须是唯一的";错误

有没有更有效的方法来检查双面标签,或者我忽略了什么?

我不确定您的id列名是什么,但像data %>% group_by(id_name) %>% summarise(count = n) %>% arrange(count)这样的东西应该将所有重复项放在顶部,这样您就可以看到它们。例如,如果您想查看mpg的哪些值在mtcars中多次出现,您可以运行:

mtcars %>% 
group_by(mpg) %>% 
summarise(count = n()) %>% 
arrange(-count)

最新更新