Subsets van rijen maken
Een groot deel van data science draait om ontdekken welke stukken van je gegevensset interessant zijn. Een van de eenvoudigste technieken is een subset vinden van rijen die aan bepaalde criteria voldoen. Dit heet ook wel rijen filteren of rijen selecteren.
Er zijn veel manieren om een subset van een DataFrame te maken. De meest gebruikelijke is het gebruik van relationele operatoren die per rij True of False teruggeven, en dat vervolgens tussen rechte haken te plaatsen.
dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]
Je kunt in één keer op meerdere voorwaarden filteren met de "bitwise and"-operator: &.
dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]
homelessness is beschikbaar en pandas is ingeladen als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____
# See the result
print(ind_gt_10k)