SAS 从一行读取多条记录,无需换行 CRLF



>我只有 1 行没有换行 (CRLF CRLF),换行是 4 个字符的字符串,在本例中是"@A$3"我暂时不需要 dlm,我需要从外部文件导入它(/files/Example.txt)

JOSH 30JUL1984 1011 SPANISH@A$3RACHEL 29OCT1986 1013 MATH@A$3JOHNATHAN 05JAN1985 1015 chemistry

我需要将这一行分成 3 行:

JOSH 30JUL1984 1011 SPANISH
RACHEL 29OCT1986 1013 MATH
JOHNATHAN 05JAN1985 1015 chemistry

如何在 SAS 中做到这一点?

*已添加:您的解决方案适用于此示例,但我有一个问题,该行包含的行超过该行允许的最大长度(32,767 字节),

例如,上述练习中的此行包含 5,000 条记录。

可能吗?

infile 语句上使用 DLMSTR= 选项 -- 这将指定 "@A$3" 作为分隔符。 然后对输入语句使用 @@ 告诉 SAS 在同一行上查找更多记录。

data test;
infile "/files/Example.txt" dsd dlmstr='@A$3';
informat var $255.;
input var $ @@;
run;

通过您的示例,您将获得一个包含 3 条记录的数据集,其中 1 个变量包含您要查找的字符串。

根据需要调整 var 的长度。

你可以做这样的事情:

首先将文件作为单行导入(请务必调整长度):

DATA WORK.IMPORTED_DATA;
INFILE "/files/Example.txt" TRUNCOVER;
LENGTH Column1 $ 255;
INPUT @1 Column1  $255.;
RUN;

然后使用数据步骤将导入的数据解析为变量:

data result (keep=var1-var4);
set  WORK.IMPORTED_DATA;
delim = '@A$3';
end = 1;
begin = 1;
do while (end > 0);
    end = find(Column1, delim, begin);
    row = substr(Column1, begin, end - begin);
    var1 = scan(row, 1);
    var2 = scan(row, 2);
    var3 = scan(row, 3);
    var4 = scan(row, 4);
    begin = end + length(delim);
    output;
end;
run;

在数据步骤中尝试此操作,方法是将@A$3视为多字符分隔符:

data want (keep=subject);
    infile 'C:sasdatatest.txt';
    input;                                                     
    length line $4500  subject $80;
    line=tranwrd(_infile_,"@A$3",'!');         
    do i=1 by 1 while (scan(line,i,'!') ^= ' ');
        subject=scan(line,i,'!');                       
        output;
    end;
run;

_infile_给出在data步骤中正在读取的当前行。我将多字符分隔符@A$2转换为单字符分隔符。 tranwrd()可以替换字符串中的子字符串。然后在 scan() 函数中使用分隔符。

此外,如果您想将值分解为单独的变量,只需再扫描一些。 例如,将类似B = scan(subject,2);的东西放入do循环中并data want (keep= A B C D);。干杯。

最新更新