"Histogramme "Step
Les histogrammes nous permettent de voir les distributions des données dans les différents groupes de nos données. Dans cet exercice, vous sélectionnerez des groupes dans l'ensemble de données des médaillés des Jeux olympiques d'été 2016 afin de comparer la taille des athlètes médaillés dans deux sports différents.
Les données sont stockées dans un objet DataFrame pandas appelé summer_2016_medals
qui possède une colonne "Height". En outre, vous disposez d'un objet pandas GroupBy qui a été regroupé par sport.
Dans cet exercice, vous allez visualiser et étiqueter les histogrammes de deux sports : "Gymnastique" et "Aviron" et constatez la différence marquée entre les médaillés de ces deux sports.
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Utilisez la méthode
hist
pour afficher un histogramme de la colonne"Weight"
du DataFramemens_rowing
, en l'appelant"Rowing"
. - Utilisez
hist
pour afficher un histogramme de la colonne"Weight"
du DataFramemens_gymnastics
et nommez-le"Gymnastics"
. - Pour les deux histogrammes, utilisez l'argument
histtype
pour visualiser les données à l'aide du type'step'
et définissez le nombre de cellules à utiliser à 5. - Ajoutez une légende à la figure avant qu'elle ne soit affichée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
fig, ax = plt.subplots()
# Plot a histogram of "Weight" for mens_rowing
____
# Compare to histogram of "Weight" for mens_gymnastics
____
ax.set_xlabel("Weight (kg)")
ax.set_ylabel("# of observations")
# Add the legend and show the Figure
____
plt.show()