Histogramme « par étapes »
Les histogrammes nous permettent de visualiser la répartition des données dans différents groupes au sein de notre ensemble de données. Dans cet exercice, vous sélectionnerez des groupes à partir de l'ensemble de données sur les médaillés des Jeux olympiques d'été 2016 afin de comparer la taille des athlètes médaillés dans deux sports différents.
Les données sont stockées dans un objet DataFrame pandas appelé summer_2016_medals qui comporte une colonne « Height ». De plus, vous recevez un objet pandas GroupBy qui a été regroupé par sport.
Dans cet exercice, vous allez visualiser et étiqueter les histogrammes de deux sports : la gymnastique et l’aviron, et vous noterez la différence notable entre les médaillés dans ces deux sports.
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Utilisez la méthode
histpour afficher un histogramme de la colonne"Weight"du DataFramemens_rowing, puis nommez-le"Rowing". - Utilisez
histpour afficher un histogramme de la colonne"Weight"du DataFramemens_gymnastics, et nommez-le"Gymnastics". - Pour les deux histogrammes, utilisez l'argument
histtypeafin de visualiser les données à l'aide du type'step'et définir le nombre de classes à utiliser sur 5. - Ajoutez une légende à la figure avant qu'elle ne soit affichée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
fig, ax = plt.subplots()
# Plot a histogram of "Weight" for mens_rowing
____
# Compare to histogram of "Weight" for mens_gymnastics
____
ax.set_xlabel("Weight (kg)")
ax.set_ylabel("# of observations")
# Add the legend and show the Figure
____
plt.show()