错误:对于SPSS到R的转换，"标签"必须是唯一的

我下载了以下文件(DS43纽约选举申报表，1885-1906(：https://www.icpsr.umich.edu/web/ICPSR/studies/1/datadocumentation#

我试着用R:打开它

data <- "00001-0042-Data.txt"
data_setup <- "00001-0042-Setup.sps"
data <- asciiSetupReader::read_ascii_setup(
data = data,
setup_file = data_setup)

但我在R中得到了以下错误：

Error: `labels` must be unique

我试着看"；变量标签"；在SPS文件中列出，方法是将其粘贴到Excel中，用空格分隔，并以这种方式识别重复项。到目前为止，我能够识别出五个重复：

858 3 G CONG 0100投票
870 3 G刚果0200票
874 3 G聪0100票
878 3 G CONG 0320票
878 3 S聪0320票

我把1放在变量的第二个实例旁边(稍后我会在检查变量是否实际相同时删除它(，但我仍然得到"0"；错误：labels必须是唯一的"；错误

有没有更有效的方法来检查双面标签，或者我忽略了什么？

我不确定您的id列名是什么，但像data %>% group_by(id_name) %>% summarise(count = n) %>% arrange(count)这样的东西应该将所有重复项放在顶部，这样您就可以看到它们。例如，如果您想查看mpg的哪些值在mtcars中多次出现，您可以运行：

mtcars %>% 
group_by(mpg) %>% 
summarise(count = n()) %>% 
arrange(-count)

相关内容

最新更新

热门标签：