Aan de slagBegin gratis

Subsets van rijen maken op basis van categorische variabelen

Subsets van gegevens maken op basis van een categorische variabele, doe je vaak met de or-operator (|) om rijen uit meerdere categorieën te selecteren. Dat kan omslachtig worden als je bijvoorbeeld alle staten in een van drie regio's wilt. Gebruik in plaats daarvan de methode .isin(). Daarmee kun je dit probleem oplossen met één voorwaarde in plaats van drie aparte.

colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]

homelessness is beschikbaar en pandas is geladen als pd.

Deze oefening maakt deel uit van de cursus

Datamanipulatie met pandas

Bekijk cursus

Oefeninstructies

Filter homelessness voor gevallen waar de USA-censuskolom state voorkomt in de lijst met Mojave-staten, canu, en sla dit op als mojave_homelessness. Bekijk het geprinte resultaat.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]

# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]

# See the result
print(mojave_homelessness)
Code bewerken en uitvoeren