C 中的正则表达式 - 搜索信用卡号 - PCI 合规性



嘿伙计们,我需要满足客户对PCI的特定需求。我对 C 语言相当满意,我真的不想在这里重做轮子。我在 python 中有一个正则表达式示例,我想在 C 中应用它。

pan_regexs = {'Mastercard': re.compile('(?:D|^)(5[1-5][0-9]{2}(?: |-|)[0-9]{4}(?: |-|)[0-9]{4}(?: |-|)[0-9]{4})(?:D|$)'), 
'Visa': re.compile('(?:D|^)(4[0-9]{3}(?: |-|)[0-9]{4}(?: |-|)[0-9]{4}(?: |-|)[0-9]{4})(?:D|$)'), 
'AMEX': re.compile('(?:D|^)((?:34|37)[0-9]{2}(?: |-|)[0-9]{6}(?: |-|)[0-9]{5})(?:D|$)')}

我找到了一些POSIX库"regex.h",这似乎使用了非常旧的正则表达式标准。

我发现了两个示例,一个使用 POSIX 正则表达式,这似乎充其量是有限的。从这里被盗

#include <regex.h>        
regex_t regex;
int reti;
char msgbuf[100];
/* Compile regular expression */
reti = regcomp(&regex, "^a[[:alnum:]]", 0);
if (reti) {
fprintf(stderr, "Could not compile regexn");
exit(1);
}
/* Execute regular expression */
reti = regexec(&regex, "abc", 0, NULL, 0);
if (!reti) {
puts("Match");
}
else if (reti == REG_NOMATCH) {
puts("No match");
}
else {
regerror(reti, &regex, msgbuf, sizeof(msgbuf));
fprintf(stderr, "Regex match failed: %sn", msgbuf);
exit(1);
}
/* Free memory allocated to the pattern buffer by regcomp() */
regfree(&regex);

我在上面看到的问题是它使用(从我收集的(旧的正则表达式,它不支持删除空格和破折号。它也只是真正执行一些匹配并寻找体面的例子,这并没有在谷歌中为我带来很多结果。所以我看得更远,在那个答案中(上面的问题(提到了 PCRE 的使用。

我在这里找到了一些演示

正如我之前所说,我不想重新发明轮子.我认为当可能存在干净和简单的东西时,为可能包含潜在缺陷的内容编写自己的正则表达式会很糟糕。

PCI问题来自一个客户,我们需要能够监控系统存储PAN的方式/位置等。它有点像DLP,审计领域,并证明CCNS存储正确。

如何使用 C 中的正则表达式搜索信用卡号?

附言。我对这个正则表达式没问题,并愿意寻找更好的方法来做这个正则表达式。

好的,我最终使用了 PCRE2,它运行得非常好。

我想我在Github上看到的源代码,但它也在这里。

我下载了它,编译了它,并安装了它。执行以下操作.. 请记住,有一个 8,16 位和 32 位格式。我看到的所有示例都使用了 8 位,我发现它最适合我正在做的事情。

./configure --enable-pcre2-8
make
make install

我还必须使它生成的库可以通过链接使用进行搜索。

ldconfig

当然,当你编译你的程序时,你需要将你的程序链接到库。 使用 -lpcre2-8,该库将命名为 PCRe2-16 , PCRe2-32 如果您使用这些版本。

之后,我编译了他们的示例

cc -Wall pcre2demo.c -lpcre2-8 -o pcre2demo

如果你不想阅读他们在巨大的例子中写的所有东西,我自己做了......警告我现在正在将其从一些功能中剥离出来,因此您可能需要仔细检查问题。但是,我将提供的示例确实有效。

// YOU MUST SPECIFY THE UNIT WIDTH BEFORE THE INCLUDE OF THE pcre.h
#define PCRE2_CODE_UNIT_WIDTH 8
#include <stdio.h>
#include <string.h>
#include <pcre2.h>
#include <stdbool.h>
int main(){
bool Debug = true;
bool Found = false;
pcre2_code *re;
PCRE2_SPTR pattern;
PCRE2_SPTR subject;
int errornumber;
int i;
int rc;
PCRE2_SIZE erroroffset;
PCRE2_SIZE *ovector;
size_t subject_length;
pcre2_match_data *match_data;

char * RegexStr = "(?:\D|^)(5[1-5][0-9]{2}(?:\ |\-|)[0-9]{4}(?:\ |\-|)[0-9]{4}(?:\ |\-|)[0-9]{4})(?:\D|$)";
char * source = "5111 2222 3333 4444";
pattern = (PCRE2_SPTR)RegexStr;// <<<<< This is where you pass your REGEX 
subject = (PCRE2_SPTR)source;// <<<<< This is where you pass your bufer that will be checked. 
subject_length = strlen((char *)subject);


re = pcre2_compile(
pattern,               /* the pattern */
PCRE2_ZERO_TERMINATED, /* indicates pattern is zero-terminated */
0,                     /* default options */
&errornumber,          /* for error number */
&erroroffset,          /* for error offset */
NULL);                 /* use default compile context */
/* Compilation failed: print the error message and exit. */
if (re == NULL)
{
PCRE2_UCHAR buffer[256];
pcre2_get_error_message(errornumber, buffer, sizeof(buffer));
printf("PCRE2 compilation failed at offset %d: %sn", (int)erroroffset,buffer);
return 1;
}

match_data = pcre2_match_data_create_from_pattern(re, NULL);
rc = pcre2_match(
re,
subject,              /* the subject string */
subject_length,       /* the length of the subject */
0,                    /* start at offset 0 in the subject */
0,                    /* default options */
match_data,           /* block for storing the result */
NULL);
if (rc < 0)
{
switch(rc)
{
case PCRE2_ERROR_NOMATCH: //printf("No matchn"); //
pcre2_match_data_free(match_data);
pcre2_code_free(re);
Found = 0;
return Found;
//  break;
/*
Handle other special cases if you like
*/
default: printf("Matching error %dn", rc); //break;
}
pcre2_match_data_free(match_data);   /* Release memory used for the match */
pcre2_code_free(re);
Found = 0;                /* data and the compiled pattern. */
return Found;
}

if (Debug){
ovector = pcre2_get_ovector_pointer(match_data);
printf("Match succeeded at offset %dn", (int)ovector[0]);
if (rc == 0)
printf("ovector was not big enough for all the captured substringsn");

if (ovector[0] > ovector[1])
{
printf("\K was used in an assertion to set the match start after its end.n"
"From end to start the match was: %.*sn", (int)(ovector[0] - ovector[1]),
(char *)(subject + ovector[1]));
printf("Run abandonedn");
pcre2_match_data_free(match_data);
pcre2_code_free(re);
return 0;
}
for (i = 0; i < rc; i++)
{
PCRE2_SPTR substring_start = subject + ovector[2*i];
size_t substring_length = ovector[2*i+1] - ovector[2*i];
printf("%2d: %.*sn", i, (int)substring_length, (char *)substring_start);
}
}
else{
if(rc > 0){
Found = true;
} 
} 
pcre2_match_data_free(match_data);
pcre2_code_free(re);
return Found;
}

相关内容

  • 没有找到相关文章

最新更新