CommencerCommencer gratuitement

Explorer l’API de Wikipedia

Vous vous en sortez si bien et vous prenez tellement de plaisir que nous allons vous proposer une dernière API : l’API de Wikipedia (documentée ici). Vous allez apprendre à trouver et extraire des informations depuis la page Wikipedia de Pizza. Ce qui devient un peu étonnant ici, c’est que votre requête renverra des JSON imbriqués, c’est-à-dire des JSON contenant d’autres JSON. Pas d’inquiétude : Python gère cela très bien en les traduisant en dictionnaires imbriqués.

L’URL qui envoie la requête correspondante à l’API de Wikipedia est

https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza

Cet exercice fait partie du cours

Importation intermédiaire de données en Python

Afficher le cours

Instructions

  • Affectez l’URL appropriée à la variable url.
  • Appliquez la méthode json() à l’objet de réponse r et stockez le dictionnaire obtenu dans la variable json_data.
  • La variable pizza_extract contient le HTML d’un extrait de la page Pizza de Wikipedia sous forme de chaîne ; utilisez la fonction print() pour afficher cette chaîne dans le terminal.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import package
import requests

# Assign URL to variable: url


# Always include a descriptive User-Agent (Wikipedia requires this)
headers = {
    "User-Agent": "Checking out the Wikipedia API"
}

# Package the request, send the request and catch the response: r
r = requests.get(url, headers=headers)

# Decode the JSON data into a dictionary: json_data


# Print the Wikipedia page extract
pizza_extract = json_data['query']['pages']['24768']['extract']
____
Modifier et exécuter le code