在 SAS 中按组填充先前观测值中的许多变量的缺失值



我的数据集如下所示:

Date  ID Var1 Var2 ... Var5
200701 1  x    .    
200702 1  .    a
200703 1  .    .
200701 2  .    b 
200702 2  y    b
200703 2  y    .
200702 3  z    .
200703 3  .    .

我希望我的结果看起来像这样:

Date  ID Var1 Var2 ... Var5
200701 1  x    .
200702 1  x    a
200703 1  x    a
200701 2  .    b 
200702 2  y    b
200703 2  y    b
200702 3  z    .
200703 3  z    .

我尝试了下面的代码,但它不起作用。怎么了? 我使用数组更好吗?如果是这样,如何?

%macro a(variable);
length _&variable $10.;
retain _&variable;
if first.ID then _&variable = '';
if &variable ne '' then _&variable=&variable;
else if &variable = '' then &variable=_&variable;
drop _&variable;
%mend;
data want;
set have;
%a(Var1)
%a(Var2)
%a(Var3)
%a(Var4)
%a(Var5)
run;

感谢您的帮助!谢谢!

UPDATE语句可以做到这一点。 它旨在处理针对主数据集的事务,因此当事务值丢失时,主表中的当前值保持不变。 您可以通过添加数据集选项将单个数据集用作主数据集和事务数据OBS=0。 通常,它期望每个 BY 组只输出一个观测值,但如果添加OUTPUT语句,则可以让它输出所有观测值。

data want;
set have(obs=0) have ;
by id;
output;
run;

完整的代码有效!谢谢

%macro a(variable);
length _&variable $10.;
retain _&variable;
if first.ID then _&variable = '';
if &variable ne '' then _&variable=&variable;
else if &variable = '' then &variable=_&variable;
drop _&variable;
%mend;
data want;
update have(obs=0) have;
by id;
output;
%a(Var1)
%a(Var2)
%a(Var3)
%a(Var4)
%a(Var5)
run;

最新更新