在Python中使用BeautifulSoup解析HTML未知错误



我知道这段代码适用于其他以。com结尾的网站

然而,我注意到,如果我试图解析以。kr

结尾的网站,代码不工作有人可以帮助找到为什么会发生这种情况和解析这些类型的网站的替代解决方案吗?

下面是我的代码。

import requests
from bs4 import BeautifulSoup
URL = 'https://everytime.kr/@nN4K1XC0weHnnM9VB5Qe'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
results = soup.find(id='container')
print(results)

这里的URL链接到我的时间表。我需要解析这个网站,这样我就可以很容易地收集到主题的信息和与主题相关的数据(时间,地点,教授的名字等)。

感谢

网站提供动态内容,你得到一个空的响应-你可以使用硒。

from selenium import webdriver
from bs4 import BeautifulSoup
import time
driver = webdriver.Chrome(executable_path=r'C:Program FilesChromeDriverchromedriver.exe')
url = 'https://everytime.kr/@nN4K1XC0weHnnM9VB5Qe'
driver.get(url)
time.sleep(5)
soup = BeautifulSoup(driver.page_source, 'html.parser')
results = soup.find(id='container')
print(results)
driver.close()

最新更新