CommencerCommencer gratuitement

Jointure, filtrage et agrégation

Dans cet exercice, vous allez utiliser ce que vous avez appris pour constituer un jeu de données et étudier comment le nombre de plaintes liées au chauffage déposées auprès de la ligne 311 de New York varie avec la température.

En plus de la table hpd311calls, le fichier data.db contient une table weather avec les relevés quotidiens des températures maximale et minimale pour NYC. Nous voulons obtenir, pour chaque jour, le nombre d’appels concernant le chauffage/l’eau chaude, avec les températures associées. On peut le faire en une seule requête, que nous allons construire étape par étape.

Dans la première partie, nous allons extraire uniquement les données souhaitées depuis hpd311calls. Puis, dans la deuxième partie, nous modifierons la requête pour y joindre les données de weather.

pandas a été importé sous le nom pd, et le moteur de base de données a été créé sous le nom engine.

Cet exercice fait partie du cours

Ingestion de données simplifiée avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Query to get heat/hot water call counts by created_date
query = """
SELECT hpd311calls.____, 
       ____
  FROM hpd311calls 
  ____ hpd311calls.____ = ____
  ____ hpd311calls.____;
"""

# Query database and save results as df
df = ____

# View first 5 records
print(df.head())
Modifier et exécuter le code