是否有Python命令将夹在两个标识符之间的字符串返回



我正在从网页html刮擦值:

location=1">MAIN BUILDING</a> : -25.49<br />

我已经成功使用Python的分区两次:一次在ID字符串MAIN BUILDING</a> :之后保存所有内容,然后再次保存零件,以在<br />

之前保存零件

使用两次使用分区似乎并不太可怕。但是有更好的方法可以做到吗?似乎应该有一种方法来提取一个夹在另外两个字符串之间的弦,而不是两个弦之间。

您可以将str.index与Python字符串索引用于单线:

>>> s = 'location=1">MAIN BUILDING</a> : -25.49<br />'
>>> begin = 'MAIN BUILDING</a> :'
>>> end = '<br />'
>>> s[s.index(begin):s.index(end)]
'MAIN BUILDING</a> : -25.49'

这假设了很多事情:

  1. 您包含的确切文本将划定所讨论的字符串。
  2. 这两个文本完全出现一次。

最新更新