Indexation booléenne pour des stats rapides
Revenons au jeu de données animals, chargé sous forme de liste de dictionnaires. Vous allez mettre en pratique tout ce que vous avez appris : transformer ces données en un DataFrame exploitable, filtrer à l’aide de l’indexation booléenne, puis faire un peu de magie avec numpy pour découvrir quelques faits intéressants sur les animaux.
Cet exercice fait partie du cours
<cours>Python pour les utilisateurs de MATLAB</cours>Instructions de l’exercice
- Créez un DataFrame
animalsà partir de la liste de dictionnairesanimals. - Créez un index booléen
mammalsen sélectionnant les enregistrements dont "Class" vaut "Mammalia". - Créez un index booléen
birdsen sélectionnant les enregistrements dont "Class" vaut "Aves". - Utilisez
numpypour calculer la moyenne de la colonne "Litter/Clutch size" pour les mammifères et les oiseaux.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create a DataFrame from animals
animals = pd.____(animals)
# Create Boolean indices for mammals and birds
mammals = animals['Class']=='____'
birds = animals['Class']=='____'
# Use numpy and the Boolean indices to determine mean Litter/Clutch size
litter = np.____(animals[mammals]['Litter/Clutch size'])
clutch = np.____(animals[____]['Litter/Clutch size'])
# Print the average Litter/Clutch size of each class
print('Mammals have an average of {} offspring in each litter.'.format(round(litter, 2)))
print('The average clutch size in a single brood is {} eggs.'.format(round(clutch, 2)))