SAS REGEX代码从10-K公司归档中捕获业务地址



请考虑以下EDGAR 10-K SEC公司备案https://www.sec.gov/archives/edgar/data/912382/000136231009004179/0001362310-09-004179.TXT

BUSINESS ADDRESS:   
    STREET 1:       107 N PENNSYLVANIA ST
    STREET 2:       STE 600
    CITY:           INDIANAPOLIS
    STATE:          IN
    ZIP:            46204
    BUSINESS PHONE:     3172619000
MAIL ADDRESS:   
    STREET 1:       107 N PENNSYLVANIA ST
    STREET 2:       STE 600
    CITY:           INDIANAPOLIS
    STATE:          IN
    ZIP:            46204

我需要在SAS中的正则延期以捕获田野街1,街2,城市,州和邮编,但在业务地址下,但不是邮寄地址。例如,对于街道1,我在SAS中使用STREETs2s*(.*),但最终捕获了街道1的邮寄地址。谢谢!

此正则应该有效。

BUSINESS ADDRESS:s*STREETs1:s*(.*)s*STREETs2:s*(.*)

您可以继续该模式以捕获新括号中所需的每个部分。基本上,您只是确保您在业务地址后获得第一个答案。您使用的模式的问题在于,它能够在两个单独的位置匹配模式,而Regex引擎只会返回其发现的最后一场比赛。因此,您必须将某些内容放在其中指定您想要的。

在SAS中,您可以将PRXPOSN函数与指示捕获缓冲区(括号(检索的第二个参数一起使用。例如。

address1=prxposn(regex_pattern, 1, edgar10);

最佳。

相关内容

  • 没有找到相关文章

最新更新