Aan de slagGa gratis aan de slag

De Wikipedia API verkennen

Je gaat zo lekker en hebt zoveel plezier dat we je nog één API voorschotelen: de Wikipedia API (gedocumenteerd hier). Je gaat uitzoeken hoe je informatie kunt vinden en ophalen van de Wikipedia-pagina over Pizza. Wat hier wat uitdagender is, is dat je query geneste JSON's teruggeeft, dus JSON's binnen JSON's. Python kan daar prima mee omgaan, omdat het die omzet naar dictionaries binnen dictionaries.

De URL die de relevante query naar de Wikipedia API stuurt, is

https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza

Deze oefening maakt deel uit van de cursus

Gevorderd data importeren in Python

Cursus bekijken

Oefeninstructies

  • Ken de relevante URL toe aan de variabele url.
  • Pas de methode json() toe op het response-object r en sla de resulterende dictionary op in de variabele json_data.
  • De variabele pizza_extract bevat de HTML van een fragment van Wikipedia's Pizza-pagina als string; gebruik de functie print() om deze string in de shell af te drukken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import package
import requests

# Assign URL to variable: url


# Always include a descriptive User-Agent (Wikipedia requires this)
headers = {
    "User-Agent": "Checking out the Wikipedia API"
}

# Package the request, send the request and catch the response: r
r = requests.get(url, headers=headers)

# Decode the JSON data into a dictionary: json_data


# Print the Wikipedia page extract
pizza_extract = json_data['query']['pages']['24768']['extract']
____
Code bewerken en uitvoeren