Automatisez votre visualisation
L'un des principaux atouts de Matplotlib réside dans sa capacité à s'automatiser pour s'adapter aux données qui lui sont fournies en entrée. Par exemple, si vous recevez des données comportant un nombre inconnu de catégories, vous pouvez tout de même créer un diagramme à barres comportant des barres pour chaque catégorie.
Voici ce que vous allez réaliser dans cet exercice. Vous allez à nouveau visualiser les données relatives aux médaillés des Jeux olympiques d'été de 2016, mais cette fois-ci, vous disposerez d'un ensemble de données contenant un nombre inconnu de disciplines sportives. Ces données seront chargées en mémoire sous la forme d'un objet pandas DataFrame appelé summer_2016_medals, qui comporte une colonne intitulée "Sport" indiquant à quelle discipline sportive correspond chaque ligne. Il existe également une rubrique intitulée "Weight" qui indique le poids de chaque athlète.
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Parcourez les valeurs de
sportsen définissantsportcomme variable de boucle. - À chaque itération, extrayez les lignes où la colonne
"Sport"est égale àsport. - Ajoutez une barre à l'objet
axfourni, étiquetée avec le nom du sport, avec la moyenne de la colonne"Weight"comme hauteur et l'écart type comme barre d'erreur sur l'axe des y. - Enregistrez l'image dans le fichier
"sports_weights.png".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
fig, ax = plt.subplots()
# Loop over the different sports branches
for ____ in ____:
# Extract the rows only for this sport
sport_df = ____
# Add a bar for the "Weight" mean with std y error bar
____
ax.set_ylabel("Weight")
ax.set_xticklabels(sports, rotation=90)
# Save the figure to file
____