Indexation booléenne pour des stats rapides
Revenons au jeu de données animals, chargé sous forme de liste de dictionnaires. Vous allez mettre en pratique tout ce que vous avez appris : transformer ces données en un DataFrame exploitable, filtrer à l’aide de l’indexation booléenne, puis faire un peu de magie avec numpy pour découvrir quelques faits intéressants sur les animaux.
Cet exercice fait partie du cours
Python pour les utilisateurs de MATLAB
Instructions
- Créez un DataFrame
animalsà partir de la liste de dictionnairesanimals. - Créez un index booléen
mammalsen sélectionnant les enregistrements dont "Class" vaut "Mammalia". - Créez un index booléen
birdsen sélectionnant les enregistrements dont "Class" vaut "Aves". - Utilisez
numpypour calculer la moyenne de la colonne "Litter/Clutch size" pour les mammifères et les oiseaux.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a DataFrame from animals
animals = pd.____(animals)
# Create Boolean indices for mammals and birds
mammals = animals['Class']=='____'
birds = animals['Class']=='____'
# Use numpy and the Boolean indices to determine mean Litter/Clutch size
litter = np.____(animals[mammals]['Litter/Clutch size'])
clutch = np.____(animals[____]['Litter/Clutch size'])
# Print the average Litter/Clutch size of each class
print('Mammals have an average of {} offspring in each litter.'.format(round(litter, 2)))
print('The average clutch size in a single brood is {} eggs.'.format(round(clutch, 2)))