Trouble with .format()



我正在尝试使用.format来格式化URL,这样我就可以抓取多个类似的网页。

当我通过时

df = pd.read_html('https://www.basketball-reference.com/players/a/abrinal01/gamelog/2019')
df

我很容易找到我想要的结果,然而当我通过时

letter = 'a'
player = str(players_from_2018[0])
year = '2019'
df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year)

我得到一个值错误,找不到表。

如果我打印

print(('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year))

我得到了我正在寻找的网址:https://www.basketball-reference.com/players/a/abrinal01/gamelog/2019

这是常见问题吗?我该如何解决?

您忘记了一些括号。

试试这个:

df = pd.read_html(('https://www.basketball-reference.com/players/{}/{}/gamelog/{}').format(letter, player, year))

但如果你的python版本是3.6+,我建议你使用f-string,以获得更干净、更可读的代码:

df = pd.read_html(f'https://www.basketball-reference.com/players/{letter}/{player}/gamelog/{year}')

括号放错了地方。试试这个:

df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}'.format(letter, player, year))

根据Dylan的建议,要么添加缺失的括号,要么删除不必要的括号并添加缺失的一个。这也应该起作用:

df = pd.read_html('https://www.basketball-reference.com/players/{}/{}/gamelog/{}'.format(letter, player, year))

在Python 中使用f-string格式

url = f'https://www.basketball-reference.com/players/{letter}/{player}/gamelog/{year}'
df = pd.read_html(url)
df

最新更新