Automatisez votre visualisation
L'une des principales forces de Matplotlib est qu'il peut être automatisé pour s'adapter aux données qu'il reçoit en entrée. Par exemple, si vous recevez des données dont le nombre de catégories est inconnu, vous pouvez toujours créer un diagramme à barres avec des barres pour chaque catégorie.
C'est ce que vous allez faire dans cet exercice. Vous allez à nouveau visualiser des données sur les médaillés des Jeux olympiques d'été de 2016, mais cette fois-ci, vous disposerez d'un ensemble de données contenant un nombre inconnu de disciplines sportives. Cet objet sera chargé en mémoire sous la forme d'un objet pandas DataFrame
appelé summer_2016_medals
, dont la colonne "Sport"
vous indique à quelle branche du sport correspond chaque ligne. Il y a également une colonne "Weight"
qui vous indique le poids de chaque athlète.
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Passez en revue les valeurs de
sports
en définissantsport
comme variable de boucle. - À chaque itération, extrayez les lignes dont la colonne
"Sport"
est égale àsport
. - Ajoutez une barre à l'objet
ax
fourni, étiqueté avec le nom du sport, avec la moyenne de la colonne"Weight"
comme hauteur, et l'écart type comme barre d'erreur sur l'axe des y. - Enregistrez la figure dans le fichier
"sports_weights.png"
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
fig, ax = plt.subplots()
# Loop over the different sports branches
for ____ in ____:
# Extract the rows only for this sport
sport_df = ____
# Add a bar for the "Weight" mean with std y error bar
____
ax.set_ylabel("Weight")
ax.set_xticklabels(sports, rotation=90)
# Save the figure to file
____