请考虑以下EDGAR 10-K SEC公司备案https://www.sec.gov/archives/edgar/data/912382/000136231009004179/0001362310-09-004179.TXT
BUSINESS ADDRESS:
STREET 1: 107 N PENNSYLVANIA ST
STREET 2: STE 600
CITY: INDIANAPOLIS
STATE: IN
ZIP: 46204
BUSINESS PHONE: 3172619000
MAIL ADDRESS:
STREET 1: 107 N PENNSYLVANIA ST
STREET 2: STE 600
CITY: INDIANAPOLIS
STATE: IN
ZIP: 46204
我需要在SAS中的正则延期以捕获田野街1,街2,城市,州和邮编,但在业务地址下,但不是邮寄地址。例如,对于街道1,我在SAS中使用STREETs2s*(.*)
,但最终捕获了街道1的邮寄地址。谢谢!
此正则应该有效。
BUSINESS ADDRESS:s*STREETs1:s*(.*)s*STREETs2:s*(.*)
您可以继续该模式以捕获新括号中所需的每个部分。基本上,您只是确保您在业务地址后获得第一个答案。您使用的模式的问题在于,它能够在两个单独的位置匹配模式,而Regex引擎只会返回其发现的最后一场比赛。因此,您必须将某些内容放在其中指定您想要的。
在SAS中,您可以将PRXPOSN函数与指示捕获缓冲区(括号(检索的第二个参数一起使用。例如。
address1=prxposn(regex_pattern, 1, edgar10);
最佳。