我对Python Crawl有点陌生,只想获得歌曲和艺术家。Scrapy 肯定会更容易做到这一点,但我想尝试使用请求和 bs4。
我知道我需要从这里获取数据:https://itunes.apple.com/us/rss/topsongs/limit=100/json
数据对我来说看起来相当复杂,如果有人能指出我正确的方向,我将不胜感激。
最好
你真的不想使用漂亮的汤,因为你有 json 数据。 您只需要请求。
import requests
url = 'https://itunes.apple.com/us/rss/topsongs/limit=100/json'
response = requests.get(url)
data = response.json()
for artist_dict in data['feed']['entry']:
artist_name = artist_dict['im:artist']['label']
song_artist = artist_dict['title']['label']
print(artist_name)