Booleaanse indexing voor snelle statistieken
We gaan terug naar de animals-gegevensset, die is geladen als een lijst met dictionaries. Je gaat alles wat je hebt geleerd gebruiken om deze data om te zetten naar een bruikbare DataFrame, de data te filteren met Booleaanse indexing en daarna wat numpy-magie toepassen om interessante dierenfeitjes te vinden.
Deze oefening maakt deel uit van de cursus
Python voor MATLAB-gebruikers
Oefeninstructies
- Maak een DataFrame
animalsvan de lijst met dictionariesanimals. - Maak een Booleaanse index
mammalsdoor records te vinden waar "Class" gelijk is aan "Mammalia". - Maak een Booleaanse index
birdsdoor records te vinden waar "Class" gelijk is aan "Aves". - Gebruik
numpyom het gemiddelde te vinden van de kolom "Litter/Clutch size" voor zoogdieren en vogels.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a DataFrame from animals
animals = pd.____(animals)
# Create Boolean indices for mammals and birds
mammals = animals['Class']=='____'
birds = animals['Class']=='____'
# Use numpy and the Boolean indices to determine mean Litter/Clutch size
litter = np.____(animals[mammals]['Litter/Clutch size'])
clutch = np.____(animals[____]['Litter/Clutch size'])
# Print the average Litter/Clutch size of each class
print('Mammals have an average of {} offspring in each litter.'.format(round(litter, 2)))
print('The average clutch size in a single brood is {} eggs.'.format(round(clutch, 2)))