regex长文本序列和python中的许多.*问题



我有这样的长序列输入。我试过灾难性回溯。但不能修复我的长序列输入。我的意思是,这段代码在for循环中迭代几次后就会卡住。你知道我在Starts_2dugaar_heseg中的错误吗?

?或任何其他方法,如regex?

Starts_2dugaar_heseg = (
r'.*Нэхэмжлэгч.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*болон.*нэхэмжлэгчийн.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*болон.*нэхэмжлэгчийн.*итгэмжлэгдсэн.*төлөөлөгч,.*өмгөөлөгч.*нар.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*нэхэмжлэлдээ:.*',
r'.*Нэхэмжлэгч.*болон.*нэхэмжлэгчийн.*өмгөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*болон.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*болон.*түүний.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл,.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*болон.*түүний.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэлдээ:.*',
r'.*Нэхэмжлэгч.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүх.*хуралдаанд.*тайлбарлахдаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэжмлэлийн.*шаардлагадаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*нэхэмжлэгч.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбар:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэлд.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбарт:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэлдээ:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэлийн.*шаардлага.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*итгэмжлэгдсэн.*төлөөлөгч.*шүүхэд.*гаргасан.*нэхэмжлэлээ.*дэмжиж.*шүүх.*хуралдаанд.*тайлбарлахдаа:.*',
r'.*Нэхэмжлэгч.*нь.*нэхэмжлэлийн.*өөрчилсөн.*шаардлагадаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэгч.*нар.*шүүхэд.*гаргасан.*нэхэмжлэлдээ:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэл.*болон.*шүүх.*хуралдаан.*дээр.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэл.*болон.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэлийн.*шаардлагаа.*дэмжиж.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэлийн.*шаардлагаа.*өөрчилж.*гаргахдаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэлийн.*шаардлагаа.*өөрчлөн.*шүүхэд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*нэхэмжлэлийн.*шаардлагыг.*тодруулахдаа.*болон.*шүүх.*хуралдаанд.*тайлбарлахдаа:.*',
r'.*Нэхэмжлэгч.*өмгөөлөгч.*шүүх.*хуралдаанд.*гаргасан.*тайлбартаа:.*',
r'.*Нэхэмжлэгч.*тал.*шүүх.*хуралдаанд.*гаргасан.*нэхэмжлэлийн.*тайлбартаа.*',
r'.*шүүхэд.*нэхэмжлэлийн.*шаардлагаа.*нэмэгдүүлэх.*болон.*өөрчлөн.*гаргахдаа:.*'
)

for pattern in Starts_2dugaar_heseg:
start_chars = line[:250]            
if re .search( pattern, start_chars ) != None:
start = True
print('start = True')

有一个正则表达式灾难性回溯问题输入序列。关于如何防止完全陷入for循环有什么想法吗?因为我习惯了很多*在我的序列中。但是有必要加上……

我找到了解决方案:

re.compile()

最新更新