我正在尝试使用.format来格式化URL,这样我就可以抓取多个类似的网页。
当我通过时
df = pd.read_html('https://www.basketball-reference.com/players/a/abrinal01/gamelog/2019')
df
我很容易找到我想要的结果,然而当我通过时
letter = 'a'
player = str(players_from_2018[0])
year = '2019'
df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year)
我得到一个值错误,找不到表。
如果我打印
print(('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year))
我得到了我正在寻找的网址:https://www.basketball-reference.com/players/a/abrinal01/gamelog/2019
这是常见问题吗?我该如何解决?
您忘记了一些括号。
试试这个:
df = pd.read_html(('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year))
但如果你的python版本是3.6+,我建议你使用f-string,以获得更干净、更可读的代码:
df = pd.read_html(f'https://www.basketball-reference.com/players/{letter}/{player}/gamelog/{year}')
括号放错了地方。试试这个:
df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}'.format(letter, player, year))
根据Dylan的建议,要么添加缺失的括号,要么删除不必要的括号并添加缺失的一个。这也应该起作用:
df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}'.format(letter, player, year))
在Python 中使用f-string格式
url = f'https://www.basketball-reference.com/players/{letter}/{player}/gamelog/{year}'
df = pd.read_html(url)
df