我正在尝试使用一个数据集,该数据集不便地将国家和年份合并为国家变量。例如,对于2006年的美国,国家变量内的相应观测值将为US2006。
有没有一种方法可以将两者分开,并生成两个新的变量,一个只包含国家名称,另一个只含年份?
正如@Roberto Ferrer所评论的,如果字符串变量的值类似于"US2006",则可以继续
gen year = real(substr(whatever, -4, 4))
gen country = substr(whatever, 1, length(whatever) - 4)
第一个语句提取最后4个字符并将它们转换为数字。第二条语句从原始变量的副本中删除最后4个字符,并将其余字符放入新变量中。