说数据集为( person
, year
)级别是指该数据集的每一行都具有不同的(person
, year
):
person year wage
Mike 2000 10
Mike 2010 30
Jack 1990 20
如何使Stata显示这些(person
,year
)变量集以唯一定义每一行?
我想制作一个日志文件
person year
仅,但不显示任何个人信息(在日志文件中显示个人的信息违反数据提供商设定的规则)。
我该怎么做?
我想的是以某种方式使用bysort
bysort person year: gen num=_n
,如果每个num
都是1,则表示(person
,year
)定义每一行。
但是,如果数据集非常大,则检查每个num
是否太乏味。有什么更聪明的方法吗?
命令isid
检查您提供的变量是否共同指定观察值。这是您可以尝试的示例:
. webuse grunfeld, clear
. isid company
variable company does not uniquely identify the observations
r(459);
. isid company year
请注意:没有新闻是个好消息。
检查问题的另一种方法是通过duplicates
。例如,尝试duplicates list person year
。就您而言,您不希望在日志中。但是,您可以首先可以通过
person
s egen id = group(person)
,然后检查id year
上的重复项。
另请参阅此常见问题解答。