我使用Stata合并了两个数据集,现在我需要找到匹配的项目的分数和数量。要做到这一点,我假设我需要计算两个计数。
如何使两个计数同时显示,然后将其中一个除以另一个?
以下是我的_merge
变量示例:
4022. | master only (1) |
4023. | matched (3) |
4024. | using only (2) |
4025. | using only (2) |
4026. | using only (2) |
4027. | matched (3) |
4028. | matched (3) |
4029. | matched (3) |
4030. | matched (3) |
我想首先计算并存储_merge
下的所有变量,然后计算那些不说"仅主"的变量。然后把两者分开。
例如:
count1 count2 fraction
6019 4020 .66 (4020/6019)
其中count1
是_merge
下的所有内容,而count2
是匹配的所有内容(仅不包括master(。
使用以下玩具示例:
clear
webuse autosize
merge 1:1 make using http://www.stata-press.com/data/r14/autoexpense
首先,确认对应于"仅主"的值是一个好主意:
list _merge
+-----------------+
| _merge |
|-----------------|
1. | matched (3) |
2. | matched (3) |
3. | matched (3) |
4. | master only (1) |
5. | matched (3) |
|-----------------|
6. | matched (3) |
+-----------------+
list _merge, nolabel
+--------+
| _merge |
|--------|
1. | 3 |
2. | 3 |
3. | 3 |
4. | 1 |
5. | 3 |
|--------|
6. | 3 |
+--------+
然后通过首先对相关观测值进行计数并进行除法来生成三个变量:
count if _merge
generate count1 = r(N)
count if _merge != 1
generate count2 = r(N)
generate fraction = count2 / count1
display count1
6
display count2
5
display fraction
1.2