我试图使用箱线图来检查分类变量和多个数值变量之间的关系。我正在使用来自kaggle的乳腺癌数据集:https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
数据将"诊断"列为分类标准/因变量(分类),其他 30 列(均为数字)作为解释变量,例如"radius_mean"、"radius_se"、"radius_worst"等。
我的问题是不要按名称列出所有 30 个变量
'剧情(radius_mean radius_se...*诊断;',
有没有办法使用更简单的命令引用所有 30 个变量名称?
谢谢!
只需使用系统视图 VCOLUMN 询问 sas 本身它有什么字段
proc sql
select name
into :num_vars separated by ' '
from SASHELP.VCOLUMN
where libname = 'YOUR_LIB' /* upper case */
and memname = 'YOUR_MEMBER' /* upper case */
and name not in ('id', 'diagnosis'); /* correct case */
quit;
这将创建一个宏变量,其中列出了您需要的所有变量
%put &num_vars;
现在使用它
proc boxplot data=YOUR_LIB.YOUR_MEMBER;
plot (&num_vars)*diagnosis;
run;