显示定义每一行的变量集

说数据集为（ person， year）级别是指该数据集的每一行都具有不同的（person， year）：

person  year  wage
  Mike   2000   10
  Mike   2010   30
  Jack   1990   20

如何使Stata显示这些（person，year）变量集以唯一定义每一行？

我想制作一个日志文件

person year

仅，但不显示任何个人信息（在日志文件中显示个人的信息违反数据提供商设定的规则）。

我该怎么做？

我想的是以某种方式使用bysort

bysort person year: gen num=_n

，如果每个num都是1，则表示（person，year）定义每一行。

但是，如果数据集非常大，则检查每个num是否太乏味。有什么更聪明的方法吗？

命令isid检查您提供的变量是否共同指定观察值。这是您可以尝试的示例：

. webuse grunfeld, clear
. isid company
variable company does not uniquely identify the observations
r(459);
. isid company year

请注意：没有新闻是个好消息。

检查问题的另一种方法是通过duplicates。例如，尝试duplicates list person year。就您而言，您不希望在日志中。但是，您可以首先可以通过

匿名您的 person s

egen id = group(person)

，然后检查id year上的重复项。

另请参阅此常见问题解答。

相关内容