正则表达式后视 - 从搜索中排除单词



我需要在我的语料库中搜索诸如游戏耻辱之类的词,但我想指定搜索以排除三个字符串一个游戏/一个耻辱或,一个游戏/一个耻辱a/an/A/一个WORD游戏或一个/an/A/一个单词耻辱,其中WORD是一个修饰符,例如,一个伟大的游戏或一个伟大的耻

如果有人能帮助我,那就太好了,谢谢!

在我的语料库中,不定冠词a/an和游戏a/an羞耻之间的可选词通常是伟大真实的所以即使排除这两个,也已经对我有很大帮助了。

下面的回溯完美地排除了A/A

(?<!as|As)bshameb

为了排除修改 WORD,我试图在后看 grep 中使用 ?\w,但它就是不起作用 - 下面的 grep 没有运行,它仍然排除了诸如耻辱之类的示例,但它仍然返回了不需要的示例,例如巨大的耻辱或哭泣耻辱- 请参阅以下示例文本中的索引行 (3( 和 (4(:

(?<!as|As|abwb|Abwb)bshameb

我用来实现正则表达式的工具是AntConc,它支持Perl正则表达式。

使用下面的搜索字符串后,包含两个不相关示例(3 和 4(的示例文本

(?<!as|As)bshameb

1(比赛耻辱(

,人们在一旁徘徊。如果你想仔细看看,你必须打电话进入并等待被录取。我想我和扫罗只是没有羞耻感(或者只是知道我们的银行账户是硬通货的好处(,因为我们徘徊在很多地方。许许多多的小精品店和设计前卫的时装店,音乐响起.txt。 47 1

2(比赛耻辱(

在过去的二十年里,我经历了各种各样的大戏,但我真的认为足球中的反黑人纳粹主义已经成为过去。你们都应该羞愧地垂下头,一群[坏话]。 亚当·菲利普斯.txt 57 1

3(不匹配羞耻感(

我和她不是

那么亲近,但她和另一个女孩真的是好朋友,这对他们来说有点混乱,这是一个很大的耻辱。不管怎样,霍莉和我从那以后就找到了我们两个人住的地方。这将花费绝对的财富,我将在aderyn上吃基本的豆子.txt 60 1

4(不匹配羞耻感(

有很多非常优秀的乐队,在全国各地演出,他们永远不会被签约,因为没有人能弄清楚如何推销他们,这是一个令人哭泣的耻辱。有一些艺术家,如Thea GilmoreAmanda Palmer& aderyn.txt 60 2

5(比赛耻辱(

/>
"现在是向这些恐怖分子表明我们不怕他们的最佳时机。相反,由于上级的懦弱行为,我们被迫羞愧地躲藏起来。

但佛罗里达州李县的高中顾问赫伯·怀斯曼(Herb Wiseman(指出了7月7日的伦敦爆炸事件.

"如果孩子们上aggy91会发生什么.txt 64 1

由于不允许使用可变长度的负回溯,因此上一个问题的答案中的方法不会转移到这个问题上。

我采用了(*SKIP)(*FAIL)模式。 这将匹配并丢弃被取消资格的比赛,并仅保留符合条件的比赛:

/[Aa]n?( w+)? shame(*SKIP)(*FAIL)|shame/3844步(演示(

或者,如果您希望包含单词边界元字符:

/b[Aa]n?( w+)? shameb(*SKIP)(*FAIL)|bshameb/4762步(演示(

相关内容

  • 没有找到相关文章

最新更新