Explorer l’API de Wikipedia
Vous vous en sortez si bien et vous prenez tellement de plaisir que nous allons vous proposer une dernière API : l’API de Wikipedia (documentée ici). Vous allez apprendre à trouver et extraire des informations depuis la page Wikipedia de Pizza. Ce qui devient un peu étonnant ici, c’est que votre requête renverra des JSON imbriqués, c’est-à-dire des JSON contenant d’autres JSON. Pas d’inquiétude : Python gère cela très bien en les traduisant en dictionnaires imbriqués.
L’URL qui envoie la requête correspondante à l’API de Wikipedia est
https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza
Cet exercice fait partie du cours
Importation intermédiaire de données en Python
Instructions
- Affectez l’URL appropriée à la variable
url. - Appliquez la méthode
json()à l’objet de réponseret stockez le dictionnaire obtenu dans la variablejson_data. - La variable
pizza_extractcontient le HTML d’un extrait de la page Pizza de Wikipedia sous forme de chaîne ; utilisez la fonctionprint()pour afficher cette chaîne dans le terminal.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import package
import requests
# Assign URL to variable: url
# Always include a descriptive User-Agent (Wikipedia requires this)
headers = {
"User-Agent": "Checking out the Wikipedia API"
}
# Package the request, send the request and catch the response: r
r = requests.get(url, headers=headers)
# Decode the JSON data into a dictionary: json_data
# Print the Wikipedia page extract
pizza_extract = json_data['query']['pages']['24768']['extract']
____