一行有效,但两行不适用于正则表达式,为什么?



我正在使用RegEx练习工具进行一些web抓取。

https://extendsclass.com/regex-tester.html

(Laboratory Confirmed Cases )([clastexwid-."= h<>/]+)([0-9]+)/s这就是我要找的。

这些是我正在搜索的。

<td class="text-white">Laboratory Confirmed Cases </td>

<td class="text-white">1264450</td>

如果我将要搜索的文本放在同一行,则存在匹配项。如果没有,就没有对手。

帮助?

我使用的是谷歌应用程序脚本/Javascript。

您需要使用n?,这表示可能有新行。

像这样的东西可以工作-

Laboratory Confirmed Cases </td>n?<td class="text-white">(d+)</td>

如图所示-

https://regex101.com/r/QBDh57/1

这将返回已确认的病例数。

或者,根据文本是trimmed()还是stripped(),您可能需要其中两个(\n?\n?(。

最新更新