我的数据集如下所示:
Date ID Var1 Var2 ... Var5
200701 1 x .
200702 1 . a
200703 1 . .
200701 2 . b
200702 2 y b
200703 2 y .
200702 3 z .
200703 3 . .
我希望我的结果看起来像这样:
Date ID Var1 Var2 ... Var5
200701 1 x .
200702 1 x a
200703 1 x a
200701 2 . b
200702 2 y b
200703 2 y b
200702 3 z .
200703 3 z .
我尝试了下面的代码,但它不起作用。怎么了? 我使用数组更好吗?如果是这样,如何?
%macro a(variable);
length _&variable $10.;
retain _&variable;
if first.ID then _&variable = '';
if &variable ne '' then _&variable=&variable;
else if &variable = '' then &variable=_&variable;
drop _&variable;
%mend;
data want;
set have;
%a(Var1)
%a(Var2)
%a(Var3)
%a(Var4)
%a(Var5)
run;
感谢您的帮助!谢谢!
UPDATE
语句可以做到这一点。 它旨在处理针对主数据集的事务,因此当事务值丢失时,主表中的当前值保持不变。 您可以通过添加数据集选项将单个数据集用作主数据集和事务数据OBS=0
。 通常,它期望每个 BY 组只输出一个观测值,但如果添加OUTPUT
语句,则可以让它输出所有观测值。
data want;
set have(obs=0) have ;
by id;
output;
run;
完整的代码有效!谢谢
%macro a(variable);
length _&variable $10.;
retain _&variable;
if first.ID then _&variable = '';
if &variable ne '' then _&variable=&variable;
else if &variable = '' then &variable=_&variable;
drop _&variable;
%mend;
data want;
update have(obs=0) have;
by id;
output;
%a(Var1)
%a(Var2)
%a(Var3)
%a(Var4)
%a(Var5)
run;