CommencerCommencer gratuitement

Histogramme « par étapes »

Les histogrammes nous permettent de visualiser la répartition des données dans différents groupes au sein de notre ensemble de données. Dans cet exercice, vous sélectionnerez des groupes à partir de l'ensemble de données sur les médaillés des Jeux olympiques d'été 2016 afin de comparer la taille des athlètes médaillés dans deux sports différents.

Les données sont stockées dans un objet DataFrame pandas appelé summer_2016_medals qui comporte une colonne « Height ». De plus, vous recevez un objet pandas GroupBy qui a été regroupé par sport.

Dans cet exercice, vous allez visualiser et étiqueter les histogrammes de deux sports : la gymnastique et l’aviron, et vous noterez la différence notable entre les médaillés dans ces deux sports.

Cet exercice fait partie du cours

Introduction à la visualisation de données avec Matplotlib

Afficher le cours

Instructions

  • Utilisez la méthode hist pour afficher un histogramme de la colonne "Weight" du DataFrame mens_rowing, puis nommez-le "Rowing".
  • Utilisez hist pour afficher un histogramme de la colonne "Weight" du DataFrame mens_gymnastics, et nommez-le "Gymnastics".
  • Pour les deux histogrammes, utilisez l'argument histtype afin de visualiser les données à l'aide du type 'step' et définir le nombre de classes à utiliser sur 5.
  • Ajoutez une légende à la figure avant qu'elle ne soit affichée.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

fig, ax = plt.subplots()

# Plot a histogram of "Weight" for mens_rowing
____

# Compare to histogram of "Weight" for mens_gymnastics
____

ax.set_xlabel("Weight (kg)")
ax.set_ylabel("# of observations")

# Add the legend and show the Figure
____
plt.show()
Modifier et exécuter le code