我有SAS中看起来像这样的数据;
Date Type_1 Type_2
4/8/2015 21654.72 .
4/9/2015 34490.13 .
4/9/2015 32429 .
4/9/2015 . 24438.76
4/9/2015 . 54043.18
4/9/2015 . 58969.06
4/9/2015 . 57721.01
4/9/2015 . 46313.08
4/10/2015 . 49974.06
4/10/2015 . 52403.41
4/10/2015 25260.07 .
4/10/2015 27891.98 .
4/11/2015 . 28130.06
4/11/2015 24886.15 .
4/11/2015 10407.6 .
4/11/2015 49422.71 .
4/11/2015 15242.28 .
4/11/2015 . 25295.52
4/11/2015 . 17522.67
4/13/2015 29798.99 .
4/13/2015 10445.17 .
4/13/2015 23678.87 .
4/13/2015 . 35470.87
4/13/2015 . 33941.01
4/13/2015 . 30206.06
4/13/2015 . 26591.98
我正在尝试使用SAS数据步骤总和type_1和type_2并按日期合并这两个列。
我尝试过这样的代码:
data work.data;
set data_consolidated;
by date;
if first.date then total_type_1=0 and total_type_2=0;
total_type_1 + type_1;
total_type_2 + type_2;
if last.date then output;
drop type_1;
drop_type_2;
run;
此代码合并日期,但并没有将日期列中的所有值汇总,而是以累积方式将当前值添加到所有以前的值。
要清楚,以下是我想获得的数据的一个示例:
date type_1 type_2
4/8/2015 21654.72 .
4/9/2015 66919.13 128472.85
4/10/2015 53152.05 102377.47
4/11/2015 99958.74 70948.25
非常感谢任何建议或帮助。
尝试以下:
proc sql;
select distinct date, sum(type_1) as type_1, sum(type_2) as type_2 from data_consolidated group by date;
quit;
我认为您的问题是这一行。
if first.date then total_type_1=0 and total_type_2=0;
这将导致将total_type_1设置为1(true)或0(false),基于分配语句右侧的布尔表达式的评估。total_type_2的值未更改。
也许您打算做:
if first.date then total_type_1=0;
if first.date then total_type_2=0;
或
if first.date then do;
total_type_1=0;
total_type_2=0;
end;
使用DOW环是在数据步骤中进行此类操作的好方法。
data want;
do until(last.date);
set data_consolidated;
by date;
total_type_1 = sum(total_type_1,type_1,0);
total_type_2 = sum(total_type_2,type_2,0);
end;
drop type_1 type_2 ;
run;