>我只有 1 行没有换行 (CRLF CRLF),换行是 4 个字符的字符串,在本例中是"@A$3"我暂时不需要 dlm,我需要从外部文件导入它(/files/Example.txt)
JOSH 30JUL1984 1011 SPANISH@A$3RACHEL 29OCT1986 1013 MATH@A$3JOHNATHAN 05JAN1985 1015 chemistry
我需要将这一行分成 3 行:
JOSH 30JUL1984 1011 SPANISH
RACHEL 29OCT1986 1013 MATH
JOHNATHAN 05JAN1985 1015 chemistry
如何在 SAS 中做到这一点?
*已添加:您的解决方案适用于此示例,但我有一个问题,该行包含的行超过该行允许的最大长度(32,767 字节),
例如,上述练习中的此行包含 5,000 条记录。
可能吗?
在 infile
语句上使用 DLMSTR=
选项 -- 这将指定 "@A$3" 作为分隔符。 然后对输入语句使用 @@
告诉 SAS 在同一行上查找更多记录。
data test;
infile "/files/Example.txt" dsd dlmstr='@A$3';
informat var $255.;
input var $ @@;
run;
通过您的示例,您将获得一个包含 3 条记录的数据集,其中 1 个变量包含您要查找的字符串。
根据需要调整 var 的长度。
你可以做这样的事情:
首先将文件作为单行导入(请务必调整长度):
DATA WORK.IMPORTED_DATA;
INFILE "/files/Example.txt" TRUNCOVER;
LENGTH Column1 $ 255;
INPUT @1 Column1 $255.;
RUN;
然后使用数据步骤将导入的数据解析为变量:
data result (keep=var1-var4);
set WORK.IMPORTED_DATA;
delim = '@A$3';
end = 1;
begin = 1;
do while (end > 0);
end = find(Column1, delim, begin);
row = substr(Column1, begin, end - begin);
var1 = scan(row, 1);
var2 = scan(row, 2);
var3 = scan(row, 3);
var4 = scan(row, 4);
begin = end + length(delim);
output;
end;
run;
在数据步骤中尝试此操作,方法是将@A$3
视为多字符分隔符:
data want (keep=subject);
infile 'C:sasdatatest.txt';
input;
length line $4500 subject $80;
line=tranwrd(_infile_,"@A$3",'!');
do i=1 by 1 while (scan(line,i,'!') ^= ' ');
subject=scan(line,i,'!');
output;
end;
run;
_infile_
给出在data
步骤中正在读取的当前行。我将多字符分隔符@A$2
转换为单字符分隔符。 tranwrd()
可以替换字符串中的子字符串。然后在 scan()
函数中使用分隔符。
此外,如果您想将值分解为单独的变量,只需再扫描一些。 例如,将类似B = scan(subject,2);
的东西放入do
循环中并data want (keep= A B C D);
。干杯。