>我有一个正则表达式,可以将文本分解成句子。然而,正则表达式搞砸了像"即"这样的缩写。有没有办法忽略缩写列表?
我有什么:
$sentences = preg_split('/(?<=[.?!])s+(?=[a-z])/i', $string);
这适用于普通字符串,但是如果使用带有"即"的文本,它会在句点处拆分它。有什么建议吗?
试一试:
(?<=(?<!b(?:[i.e.])b)[.!?])s+(?=[w])