Charger des données JSON
De nombreux portails de données ouvertes proposent des jeux de données JSON particulièrement faciles à analyser. Ils sont accessibles directement via une URL. Chaque objet correspond à un enregistrement, tous les objets partagent le même ensemble d’attributs, et aucune valeur n’est un objet imbriqué nécessitant une analyse supplémentaire.
Le rapport quotidien du Department of Homeless Services de la ville de New York est un jeu de données de ce type : il contient plusieurs années de comptages de la population dans les centres d’hébergement. Vous pouvez l’afficher dans la console avant de le charger dans un dataframe à l’aide de la fonction read_json() de pandas.
Cet exercice fait partie du cours
Ingestion de données simplifiée avec pandas
Instructions
- Familiarisez-vous avec le contenu de
dhs_daily_report.json, affiché dans la console. - Importez
pandassous l’aliaspd. - Utilisez
read_json()pour chargerdhs_daily_report.jsondans un dataframe nommépop_in_shelters. - Affichez des statistiques descriptives sur
pop_in_sheltersavec la méthodedescribe()du dataframe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load pandas as pd
____
# Load the daily report to a dataframe
pop_in_shelters = ____
# View summary stats about pop_in_shelters
print(____)