Filteren op meerdere voorwaarden
Tot nu toe heb je selectief records geïmporteerd die aan één voorwaarde voldeden, maar het is ook gebruikelijk om gegevenssets op meerdere criteria te filteren. In deze oefening ga je dat doen.
De tabel weather bevat dagelijkse maximum- en minimumtemperaturen en neerslaghoeveelheden voor New York City. We richten ons op guur weer, waarbij er óf een inch of meer sneeuw viel óf de maximumtemperatuur op of onder het vriespunt lag (32° Fahrenheit). Hiervoor bouw je een query die de operator OR gebruikt om naar waarden in beide kolommen te kijken.
pandas is geladen als pd, en er is een database-engine engine aangemaakt.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Oefeninstructies
- Maak een query die records selecteert in
weatherwaartmaxkleiner dan of gelijk is aan 32 gradenORsnowgroter dan of gelijk is aan 1 inch. - Gebruik
read_sql()om de database te bevragen en wijs het resultaat toe aan de variabelewintry_days. - Bekijk samenvattende statistieken met de methode
describe()om te controleren dat alle records in de dataframe aan de gegeven criteria voldoen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create query for records with max temps <= 32 or snow >= 1
query = """
SELECT *
FROM weather
____ ____
____ ____;
"""
# Query database and assign result to wintry_days
wintry_days = pd.read_sql(____)
# View summary stats about the temperatures
print(____)