CommencerCommencer gratuitement

Indexation booléenne pour des stats rapides

Revenons au jeu de données animals, chargé sous forme de liste de dictionnaires. Vous allez mettre en pratique tout ce que vous avez appris : transformer ces données en un DataFrame exploitable, filtrer à l’aide de l’indexation booléenne, puis faire un peu de magie avec numpy pour découvrir quelques faits intéressants sur les animaux.

Cet exercice fait partie du cours

Python pour les utilisateurs de MATLAB

Afficher le cours

Instructions

  • Créez un DataFrame animals à partir de la liste de dictionnaires animals.
  • Créez un index booléen mammals en sélectionnant les enregistrements dont "Class" vaut "Mammalia".
  • Créez un index booléen birds en sélectionnant les enregistrements dont "Class" vaut "Aves".
  • Utilisez numpy pour calculer la moyenne de la colonne "Litter/Clutch size" pour les mammifères et les oiseaux.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a DataFrame from animals
animals = pd.____(animals)

# Create Boolean indices for mammals and birds
mammals = animals['Class']=='____'
birds = animals['Class']=='____'

# Use numpy and the Boolean indices to determine mean Litter/Clutch size
litter = np.____(animals[mammals]['Litter/Clutch size'])
clutch = np.____(animals[____]['Litter/Clutch size'])

# Print the average Litter/Clutch size of each class
print('Mammals have an average of {} offspring in each litter.'.format(round(litter, 2)))
print('The average clutch size in a single brood is {} eggs.'.format(round(clutch, 2)))
Modifier et exécuter le code