在单引号或双引号外用分号分隔的RegEx



我需要一个JavaScript RegEx,在引号外用分号分隔字符串。

事实上,我使用的是下面的正则表达式/(?!B['"][^'"]*);(?![^'"]*['"]B)/gm,遗憾的是它并没有涵盖所有情况。

我需要什么:

const string = `Lorem ipsum; "dolor sit; amet"; consectetur 'adipiscing; elit.' Fusce; sit amet ligula.; Phasellus in laoreet quam.`;
const resultArr = string.split(/THEREGEX/gm);
console.log(resultArr);
// ["Lorem ipsum", ""dolor sit; amet"", " consectetur 'adipiscing; elit.' Fusce", "sit amet ligula.", " Phasellus in laoreet quam."]

您可以使用以下正则表达式:

((?:[^;'"]*(?:"(?:\.|[^"])*"|'(?:\.|[^'])*')[^;'"]*)+)|;

RegEx演示

代码:

const s = `Lorem ipsum; "dolor sit; amet"; consectetur 'adipiscing; elit.' Fusce; sit amet ligula.; Phasellus in laoreet quam.`
const re = /((?:[^;'"]*(?:"(?:\.|[^"])*"|'(?:\.|[^'])*')[^;'"]*)+)|;/
console.log( s.split(re).filter(Boolean) )

RegEx详细信息:

  • (:启动捕获组#1
    • [^;'"]*:匹配0个或多个非'"且非;的任何字符
    • (?::启动非捕获组
      • "(?:\.|[^"])*":匹配双引号子字符串,忽略所有转义引号
      • |:或
      • '(?:\.|[^'])*':匹配单引号子字符串,忽略所有转义引号
    • ):结束非捕获组
    • [^;'"]*:匹配0个或多个非'"且非;的任何字符
  • ):结束捕获组#1
  • |:或
  • ;:匹配;
  • .filter(Boolean):用于从拆分数组中删除空结果

最新更新