CommencerCommencer gratuitement

Automatisez votre visualisation

L'une des principales forces de Matplotlib est qu'il peut être automatisé pour s'adapter aux données qu'il reçoit en entrée. Par exemple, si vous recevez des données dont le nombre de catégories est inconnu, vous pouvez toujours créer un diagramme à barres avec des barres pour chaque catégorie.

C'est ce que vous allez faire dans cet exercice. Vous allez à nouveau visualiser des données sur les médaillés des Jeux olympiques d'été de 2016, mais cette fois-ci, vous disposerez d'un ensemble de données contenant un nombre inconnu de disciplines sportives. Cet objet sera chargé en mémoire sous la forme d'un objet pandas DataFrame appelé summer_2016_medals, dont la colonne "Sport" vous indique à quelle branche du sport correspond chaque ligne. Il y a également une colonne "Weight" qui vous indique le poids de chaque athlète.

Cet exercice fait partie du cours

Introduction à la visualisation de données avec Matplotlib

Afficher le cours

Instructions

  • Passez en revue les valeurs de sports en définissant sport comme variable de boucle.
  • À chaque itération, extrayez les lignes dont la colonne "Sport" est égale à sport.
  • Ajoutez une barre à l'objet ax fourni, étiqueté avec le nom du sport, avec la moyenne de la colonne "Weight" comme hauteur, et l'écart type comme barre d'erreur sur l'axe des y.
  • Enregistrez la figure dans le fichier "sports_weights.png".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

fig, ax = plt.subplots()

# Loop over the different sports branches
for ____ in ____:
  # Extract the rows only for this sport
  sport_df = ____
  # Add a bar for the "Weight" mean with std y error bar
  ____

ax.set_ylabel("Weight")
ax.set_xticklabels(sports, rotation=90)

# Save the figure to file
____
Modifier et exécuter le code