Aan de slagGa gratis aan de slag

Filteren op meerdere voorwaarden

Tot nu toe heb je selectief records geïmporteerd die aan één voorwaarde voldeden, maar het is ook gebruikelijk om gegevenssets op meerdere criteria te filteren. In deze oefening ga je dat doen.

De tabel weather bevat dagelijkse maximum- en minimumtemperaturen en neerslaghoeveelheden voor New York City. We richten ons op guur weer, waarbij er óf een inch of meer sneeuw viel óf de maximumtemperatuur op of onder het vriespunt lag (32° Fahrenheit). Hiervoor bouw je een query die de operator OR gebruikt om naar waarden in beide kolommen te kijken.

pandas is geladen als pd, en er is een database-engine engine aangemaakt.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Cursus bekijken

Oefeninstructies

  • Maak een query die records selecteert in weather waar tmax kleiner dan of gelijk is aan 32 graden OR snow groter dan of gelijk is aan 1 inch.
  • Gebruik read_sql() om de database te bevragen en wijs het resultaat toe aan de variabele wintry_days.
  • Bekijk samenvattende statistieken met de methode describe() om te controleren dat alle records in de dataframe aan de gegeven criteria voldoen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create query for records with max temps <= 32 or snow >= 1
query = """
SELECT *
  FROM weather
  ____ ____
  ____ ____;
"""

# Query database and assign result to wintry_days
wintry_days = pd.read_sql(____)

# View summary stats about the temperatures
print(____)
Code bewerken en uitvoeren