如何在python中从页面上的"Inspect element"获取链接?



我需要从网页获取视频链接。我点击inspect元素并转到Network选项卡,然后我看到了一个我需要获取的链接。。。但是我如何通过python访问这个链接?

情况如下:https://i.stack.imgur.com/qH26K.jpg

链接位于标题中:

https://i.stack.imgur.com/2XtUM.jpg

我只需要链接,我不需要下载视频。

最好的道路是什么?也许是硒?

硒是有效的。你要做的是在DOM中找到引入它的元素。不过,在走这条路之前,你应该试着手动找出你想要的元素。您可能正在查找视频标记及其子源标记。

HTML 5视频标签文档:http://www.w3schools.com/tags/tag_video.asp

硒选择器文档:https://selenium-python.readthedocs.org/locating-elements.html

您只需要执行一个HTTP请求来获取页面,然后通过响应来获取url。您需要定义XPath并使用lxml来获取URL。类似(这只是一个例子,可能不会直接起作用):

import lxml.html as parser
import requests
path = <define the XPATH>
url = <your url>
data = do_request(url)
if data:
    doc = parser.fromstring(data) 
    url_res = doc.xpath(path) #the url from the webpage
#do_requests() example
def do_request(url):
    r = requests.get(url)
    return r.text if r.status_code == 200 else None

最新更新