Subsets van rijen maken op basis van categorische variabelen
Subsets van gegevens maken op basis van een categorische variabele, doe je vaak met de or-operator (|) om rijen uit meerdere categorieën te selecteren. Dat kan omslachtig worden als je bijvoorbeeld alle staten in een van drie regio's wilt.
Gebruik in plaats daarvan de methode .isin(). Daarmee kun je dit probleem oplossen met één voorwaarde in plaats van drie aparte.
colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]
homelessness is beschikbaar en pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
Filter homelessness voor gevallen waar de USA-censuskolom state voorkomt in de lijst met Mojave-staten, canu, en sla dit op als mojave_homelessness. Bekijk het geprinte resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]
# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]
# See the result
print(mojave_homelessness)