我有一个雇主-雇员数据库,只需要保留至少有一个同事考虑Firm_id变量的个人,但我不知道如何在Stata中做到这一点。我的数据集是这样的:
Id Firm_id Year
1 50 2010
1 50 2011
2 50 2010
2 50 2011
3 22 2010
3 22 2011
4 22 2010
4 20 2011
在上面的例子中,我将只保留Id 1和2对应的个人,因为他们在样本中的两个年份都在同一家公司,Id 3和4在2010年。
我要找的输出是:
Id Firm_id Year
1 50 2010
1 50 2011
2 50 2010
2 50 2011
3 22 2010
4 22 2010
关于如何在Stata中执行此操作有什么建议吗?
问候,
bysort Id (Firm_id) : keep if Firm_id[1] == Firm_id[_N]
见这里的"常见问题解答"。