Visualiser la distribution des revenus internationaux
seaborn est une bibliothèque Python de visualisation pour l’analyse statistique, basée sur matplotlib.
Par défaut, la fonction distplot() du package seaborn crée un histogramme, où les données sont regroupées en intervalles et représentées par des barres, et ajuste une estimation par noyau (KDE), c’est‑à‑dire un histogramme lissé. Vous pouvez aussi utiliser distplot() pour créer un autre type de graphique appelé rugplot, qui ajoute des marqueurs en bas du graphique pour indiquer la densité des observations le long de l’axe des x.
seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, ...)
Dans les exercices précédents, vous avez créé un graphique quantile qui donnait une vision assez fine du niveau de revenu par habitant à différents points de la distribution. Ici, vous allez utiliser distplot() pour obtenir une vue d’ensemble !
pandas a été importé sous l’alias pd, et le DataFrame income de l’exercice précédent est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Importer et gérer des données financières en Python
Instructions
- Importez
seabornsous l’aliassnsetmatplotlib.pyplotsous l’aliasplt. - Affichez les statistiques récapitulatives fournies par
.describe(). - Tracez et affichez un histogramme simple de la colonne
'Income per Capita'avec.distplot(). - Créez et affichez un rugplot des mêmes données en fixant les arguments supplémentaires
binsà 50,kdeàFalseetrugàTrue.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import seaborn and matplotlib
____
____
# Print the summary statistics for income
print(____.____())
# Plot a basic histogram of income per capita
____
# Show the plot
plt.show()
# Plot a rugplot
sns.distplot(income['Income per Capita'], ____, ____, ____)
# Show the plot
plt.show()