我在Stata中有一个数据集,其中包含变量age
和carrier
,这是特定疾病携带者的指标。
使用univar age
,我可以获得数据集的age
的一些描述性统计数据,但现在我想比较携带者和非携带者之间的平均值/中位数/IQ范围。有办法做到这一点吗?
到目前为止,我已经尝试了一条线路:
univar age if carrier = 1
导致无效语法错误,r(198(
当carrier
为1时,我曾期望年龄的描述性统计数据。
样本数据
clear
set obs 100
gen age = runiformint(18,70)
gen carrier = runiformint(0,1)
汇总统计
在Stata
中有几种方法可以获得摘要统计信息,但有一种方法是使用tabstat
命令:
tabstat age, by(carrier) statistics(n mean sd min p25 median p75 max iqr)
Summary for variables: age
Group variable: carrier
carrier | N Mean SD Min p25 p50 p75 Max IQR
---------+------------------------------------------------------------------------------------------
0 | 52 43.96154 16.45667 19 30 39.5 59 70 29
1 | 48 48.4375 14.24692 20 39 49 60.5 69 21.5
---------+------------------------------------------------------------------------------------------
Total | 100 46.11 15.52183 19 33 44 59.5 70 26.5
----------------------------------------------------------------------------------------------------
有关其他statistics
选项,请参见help tabstat
。
编辑以模拟univar
的输出。
如果你还没有听说过univar
,那么你必须非常努力地使用search
。它的社区贡献和日期从1997年和1999年:
STB-51 sg67.1 . . . . . . . . . . . . . . . . . . . . . . . Update to univar
(help univar if installed) . . . . . . . . . . . . . . J. R. Gleason
9/99 pp.27--28; STB Reprints Vol 9, pp.159--161
improvements and new options to univar
STB-36 sg67 . . . . . . . . . . . . . . . Univariate summaries with boxplots
(help univar if installed) . . . . . . . . . . . . . . J. R. Gleason
3/97 pp.23--25; STB Reprints Vol 6, pp.179--183
command that offers a streamlined display of univariate summaries,
including, optionally, text-mode boxplots
查看它的帮助表明您需要它的by()
选项。这是一个可复制的示例:
. sysuse auto, clear
(1978 automobile data)
. univar mpg, by(foreign)
-> foreign=Domestic
-------------- Quantiles --------------
Variable n Mean S.D. Min .25 Mdn .75 Max
-------------------------------------------------------------------------------
mpg 52 19.83 4.74 12.00 16.50 19.00 22.00 34.00
-------------------------------------------------------------------------------
-> foreign=Foreign
-------------- Quantiles --------------
Variable n Mean S.D. Min .25 Mdn .75 Max
-------------------------------------------------------------------------------
mpg 22 24.77 6.61 14.00 21.00 24.50 28.00 41.00
-------------------------------------------------------------------------------
像@JR96一样,我在这里推荐tabstat
。