我正在使用RegEx练习工具进行一些web抓取。
https://extendsclass.com/regex-tester.html
(Laboratory Confirmed Cases )([clastexwid-."= h<>/]+)([0-9]+)/s
这就是我要找的。
这些是我正在搜索的。
<td class="text-white">Laboratory Confirmed Cases </td>
<td class="text-white">1264450</td>
如果我将要搜索的文本放在同一行,则存在匹配项。如果没有,就没有对手。
帮助?
我使用的是谷歌应用程序脚本/Javascript。
您需要使用n?
,这表示可能有新行。
像这样的东西可以工作-
Laboratory Confirmed Cases </td>n?<td class="text-white">(d+)</td>
如图所示-
https://regex101.com/r/QBDh57/1
这将返回已确认的病例数。
或者,根据文本是trimmed()
还是stripped()
,您可能需要其中两个(\n?\n?(。