在短语和句号之间拉字符串

  • 本文关键字:之间 字符串 短语 sas
  • 更新时间 :
  • 英文 :


我得到了一个excel文件,其中有人将所有信息存储在一列(var1(中。我需要提取信息,但它将按随机顺序排列。好的是,这个人提供了信息,然后在之后加了一段时间。我在SAS中拔出了var1。

Var1观测的3个例子:

  1. 类型=2。尺寸=4英寸x 12英寸组=ABC分组。

  2. 集团=A和B控股。类型=1。

  3. 组=标记H和公司。

我需要提取的变量是group。它总是以";组=";并且最终具有一个周期。但是会在var1中的任何位置(所以你不能命名特定的句点。有时它可能不存在。这个变量可以是任何长度的单词。我只需要在"Group="和句点之间拉一个字符串。

由于数据集的大小,这无法在excel中完成。

我已经尝试过扫描,查找,在这个时期分裂,我不确定在这一点上该做什么来组织它。

这个怎么样?

data have;
infile cards4 truncover;
input line $100.;
list;
cards4;
Type = 2. Size = 4 in x 12 in. Group = ABC grouping.
Group = A and B Holdings. Type = 1. 
Group = Mark H and Company. 
;;;;
run;

data more;
set have;
infile cards4;
input @1 @;
_INFILE_ = line;
length type size group $48;
_infile_= transtrn(_infile_,' = ','=');
input (_all_)(=);
list;
cards4;
Type = 2. Size = 4 in x 12 in. Group = ABC grouping.
Group = A and B Holdings. Type = 1. 
Group = Mark H and Company. 
;;;;
run;
proc print;
run;

最新更新