将未知日期/日期时间格式的字符变量转换为数字日期



我有大约 30 个数据集,每个数据集中大约有 20 个日期字段,其中变量类型在字符和数字之间以及日期和日期时间格式之间有所不同,即以下情况......

a.( 数字 - 日期b.)数字 - 日期时间c.( 字符 - 日期d.( 字符 - 日期时间

我想将每个单独的字段转换为数字和日期9格式。我尝试在下面编写宏,当变量是字符串时,它不会产生正确的结果。出了什么问题?...如果未正确指定字符变量 dateformat,则 SAS 似乎无法正确解释输入语句。

%macro converttodate(inlib,indata,outlib,outdata,invar,outvar);
ods listing close;
ods output dataset.variables = work.formats;
proc contents data = &inlib..&indata.;
run;
data work.formats;
    set work.formats;
    where lowcase(compress(variable)) = lowcase(compress("&invar."));
run;
data _NULL_;    
    set work.formats;
    call symput('dtype',compress(lowcase(type)));
    call symput('dformat',compress(lowcase(format)));
    call symput('dlen',compress(put(len,8.)));
run;
%PUT INVAR  = ** &invar. ** OUTVAR = ** &outvar. **;
%PUT TYPE   = ** &dtype. **;
%PUT FORMAT = ** &dformat. **;
%PUT LENGTH = ** &dlen. **;
%if &dtype. = num %then %do;
    data &outlib..&outdata.;
        length tmp_put $50; 
        set &inlib..&indata.;
        format &outvar. date9.;
        tmp_put = compress(put(&invar.,&dformat.));
        if index(tmp_put,':') > 0 then &outvar. = datepart(&invar.); 
        else &outvar. = &invar.;
        drop tmp_put;
    run;
%end;
%else %do;
    data &outlib..&outdata.;
        set &inlib..&indata.;
        format &outvar. date9.;
        if index(&invar.,':') > 0 then &outvar. = datepart(input(&invar.,datetime.)); 
        else &outvar. = input(&invar.,date.);
    run;
%end;
%mend;

例如

data work.test;
    format x1 date9. y1 datetime30.6;
    x1 = mdy(10,16,1922);
    x2 = put(x1,date9.);
    y1 = 100000;
    y2 = put(y1,datetime30.6);
run;

%converttodate(
    inlib   = work,
    indata  = test,
    outlib  = work,
    outdata = test,
    invar   = x2,
    outvar  = x2_out);

中的这一行导致了意外行为:

else &outvar. = input(&invar.,date.);

日期的默认长度为 7,因此它将日期读取为 16OCT19,即 2019 年

http://support.sas.com/documentation/cdl/en/etsug/60372/HTML/default/viewer.htm#etsug_intervals_sect008.htm

如果将其更改为date9,它将正常工作。如果要更改整个宏,可以查看inputn函数,其中函数的第二个参数可以由输入数据的长度动态确定。

data &outlib..&outdata.;
    set &inlib..&indata.;
    format &outvar. date9.;
    in_format=catt("date", &dlen.);
    if index(&invar.,':') > 0 then &outvar. = datepart(input(&invar.,datetime.)); 
    else &outvar. = inputn(&invar.,in_format);
run;

如果我在输入语句中使用字符串的正确长度,输出变量似乎变得正确。我在 %else %do 之后调整了代码;如下

%else %do;
    data _NULL_;
        set &inlib..&indata.;
        if length(compress(&invar.)) > 1 then do;
            call symput('dlen2',compress(put(length(compress(&invar.)),8.)));
            call symput('colon',compress(put((index(&invar.,':') > 0),8.)));
            stop;
        end;
        else do;
            call symput('dlen2','0');
        end;
    run;
    %if &dlen2. ^= 0 %then %do;
        data &outlib..&outdata.;
            set &inlib..&indata.;
            format &outvar. date9.;
            %if &colon. = 1 %then %do;
                &outvar. = datepart(input(&invar.,datetime&dlen2..)); 
            %end;
            %else %do;
                &outvar. = input(&invar.,date&dlen2..);
            %end;
        run;
    %end;
    %else %do;
        %PUT NO VALID OBSERVATIONS;
    %end;
%end;

最新更新