Création de diagrammes en boîte
Les diagrammes en boîte fournissent des informations supplémentaires sur la distribution des données qu'ils représentent. Ils nous indiquent la médiane de la distribution, l'intervalle interquartile et l'intervalle attendu pour environ 99 % des données. Les valeurs aberrantes situées au-delà de cette fourchette sont particulièrement mises en évidence.
Dans cet exercice, vous utiliserez les données sur les hauteurs des médaillés que vous avez précédemment visualisées sous forme d'histogrammes et de diagrammes à barres avec barres d'erreur, et vous les visualiserez sous forme de diagrammes en boîte.
Là encore, vous disposez des DataFrames mens_rowing
et mens_gymnastics
, et ces deux DataFrames ont des colonnes appelées "Height"
que vous allez comparer.
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Créez un diagramme en boîte contenant la colonne
"Height"
pourmens_rowing
à gauche etmens_gymnastics
à droite. - Ajoutez les étiquettes de l'axe des x :
"Rowing"
et"Gymnastics"
. - Ajoutez une étiquette à l'axe des ordonnées :
"Height (cm)"
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
fig, ax = plt.subplots()
# Add a boxplot for the "Height" column in the DataFrames
____
# Add x-axis tick labels:
____
# Add a y-axis label
____
plt.show()