显示定义每一行的变量集



说数据集为( personyear)级别是指该数据集的每一行都具有不同的(personyear):

person  year  wage
  Mike   2000   10
  Mike   2010   30
  Jack   1990   20

如何使Stata显示这些(personyear)变量集以唯一定义每一行?

我想制作一个日志文件

person year

仅,但不显示任何个人信息(在日志文件中显示个人的信息违反数据提供商设定的规则)。

我该怎么做?

我想的是以某种方式使用bysort

bysort person year: gen num=_n

,如果每个num都是1,则表示(personyear)定义每一行。

但是,如果数据集非常大,则检查每个num是否太乏味。有什么更聪明的方法吗?

命令isid检查您提供的变量是否共同指定观察值。这是您可以尝试的示例:

. webuse grunfeld, clear
. isid company
variable company does not uniquely identify the observations
r(459);
. isid company year

请注意:没有新闻是个好消息。

检查问题的另一种方法是通过duplicates。例如,尝试duplicates list person year。就您而言,您不希望在日志中。但是,您可以首先可以通过

匿名您的 person s
egen id = group(person) 

,然后检查id year上的重复项。

另请参阅此常见问题解答。

最新更新