Aan de slagGa gratis aan de slag

Joinen, filteren en aggregeren

In deze oefening ga je gebruiken wat je hebt geleerd om een gegevensset samen te stellen waarmee je onderzoekt hoe het aantal meldingen over verwarming bij de 311-lijn van New York City varieert met de temperatuur.

Naast de tabel hpd311calls bevat data.db een weather-tabel met dagelijkse maximum- en minimumtemperaturen voor NYC. We willen per dag het aantal meldingen over heat/hot water ophalen en deze koppelen aan de temperaturen. Dit kan in één query, die we in delen opbouwen.

In deel één halen we precies de data op die we nodig hebben uit hpd311calls. In deel twee passen we de query aan om weather-data erbij te joinen.

pandas is geïmporteerd als pd, en de database-engine is aangemaakt als engine.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Query to get heat/hot water call counts by created_date
query = """
SELECT hpd311calls.____, 
       ____
  FROM hpd311calls 
  ____ hpd311calls.____ = ____
  ____ hpd311calls.____;
"""

# Query database and save results as df
df = ____

# View first 5 records
print(df.head())
Code bewerken en uitvoeren