我需要将我的数据集转换为面板数据集,但我在 Stata 帮助和 Google 中都找不到任何操作方法。我的数据如下所示:
[阿] [乙] [中] [德] [英]
[1] [1] [0] [10] [12]
[2] [0] [0] [13] [14]
[3] [1] [1] [15] [17]
A是学生证,D和E是他们在两个不同年份的考试成绩。因此,我需要数据如下所示:
[阿] [b] [c] [(D和E)]
[(D)1] [1] [0] [10]
[(E)1] [1] [0] [12]
[(D)2] [0] [0] [13]
[(E)2] [0] [0] [14]
[(D)3] [1] [1] [15]
[(E)3] [1] [1] [17]
最好
浏览数据管理手册的标题 [D] 或 https://www.stata.com/manuals/d.pdf,以查找相关命令。这里直接的小问题是变量名称选择不当——至少在数据示例中是这样;我们无法判断您是否在真实数据中使用了更合理的名称。然后,您的新数据布局是reshape long
的简单应用程序。
clear
input A B C D E
1 1 0 10 12
2 0 0 13 14
3 1 1 15 17
end
rename A id
rename (D E) (mark2015 mark2016)
reshape long mark, i(id) j(year)
list, sepby(id)
+--------------------------+
| id year B C mark |
|--------------------------|
1. | 1 2015 1 0 10 |
2. | 1 2016 1 0 12 |
|--------------------------|
3. | 2 2015 0 0 13 |
4. | 2 2016 0 0 14 |
|--------------------------|
5. | 3 2015 1 1 15 |
6. | 3 2016 1 1 17 |
+--------------------------+
适合随时间变化的数据的变量名称将具有通用前缀和一个数字后缀,表示时间,例如mark
和2015
和2016
。