报废财务数据雅虎-Python



我目前正试图雅虎财经中抓取BitCoin历史财务数据,同时仍然可以选择何时开始挖掘数据。我的代码如下,但是出现了一个错误,告诉我"HTTP错误404:找不到">。。。你能告诉我这个错误是从哪里来的以及如何修复它吗?

import time
import datetime
import pandas as pd
period1 = int(time.mktime(datetime.datetime(2020, 1, 1, 23, 59).timetuple()))
period2 = int(time.mktime(datetime.datetime(2022, 1, 1, 23, 59).timetuple()))
basic_url = 'https://fr.finance.yahoo.com/quote/BTC-USD/historyperiod1=1606780800&period2=1609372800&interval=1dk&filter=history&frequency=1wk&includeAdjustedClose=true'
modified_url = 'https://fr.finance.yahoo.com/quote/BTC-USD/history?period1={period1}&period2={period2}&interval=1d&filter=history&frequency=1d&includeAdjustedClose=true'
df=pd.read_csv(modified_url)
df

提前感谢!

Thibaut

您的逻辑是合理的。

然而,你的地址似乎错了。我检查了他们的网站和直接工作链接是:

modified_url =f'https://query1.finance.yahoo.com/v7/finance/download/BTC-USD?period1={period1}&period2={period2}&interval=1d&events=history&includeAdjustedClose=true'

编辑:

由于您已经转换为Integer,所以不需要f-string。同时尽量不要将变量用作"a"。这些问题以后很难弄清楚。

input_year = int(input("A partir de quelle année voulez-vous commencer le scraping de données?n"))
period1 = int(time.mktime(datetime.datetime(input_year, 1, 1, 23, 59).timetuple()))

如果您尝试访问浏览器上的URL,则可以看到问题。它没有去任何地方,被重新导演-所以404。

要修复它,请使用一个有效的URL。也许你在GET参数中犯了一个错误?

最新更新