De Wikipedia API verkennen
Je gaat zo lekker en hebt zoveel plezier dat we je nog één API voorschotelen: de Wikipedia API (gedocumenteerd hier). Je gaat uitzoeken hoe je informatie kunt vinden en ophalen van de Wikipedia-pagina over Pizza. Wat hier wat uitdagender is, is dat je query geneste JSON's teruggeeft, dus JSON's binnen JSON's. Python kan daar prima mee omgaan, omdat het die omzet naar dictionaries binnen dictionaries.
De URL die de relevante query naar de Wikipedia API stuurt, is
https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza
Deze oefening maakt deel uit van de cursus
Gevorderd data importeren in Python
Oefeninstructies
- Ken de relevante URL toe aan de variabele
url. - Pas de methode
json()toe op het response-objectren sla de resulterende dictionary op in de variabelejson_data. - De variabele
pizza_extractbevat de HTML van een fragment van Wikipedia's Pizza-pagina als string; gebruik de functieprint()om deze string in de shell af te drukken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import package
import requests
# Assign URL to variable: url
# Always include a descriptive User-Agent (Wikipedia requires this)
headers = {
"User-Agent": "Checking out the Wikipedia API"
}
# Package the request, send the request and catch the response: r
r = requests.get(url, headers=headers)
# Decode the JSON data into a dictionary: json_data
# Print the Wikipedia page extract
pizza_extract = json_data['query']['pages']['24768']['extract']
____