Déciles de la distribution mondiale des revenus
Un décile est un type particulier de quantile obtenu en divisant la distribution d’un jeu de données en dix parts. Les déciles (comme tout autre type de quantile) peuvent être créés en fournissant la fonction numpy suivante à .quantile(), où start est le début de l’intervalle (inclusif), stop est la fin de l’intervalle (exclusif) et step est l’écart entre deux valeurs adjacentes :
np.arange(start, stop, step)
Comme vous l’avez vu dans la vidéo, un histogramme standard est un excellent moyen de visualiser la distribution des données. Vous pouvez en créer un en ajoutant kind='bar' comme argument à .plot().
À vous de jouer : appliquez cela pour tracer un résumé de la distribution des revenus par déciles ! pandas sous l’alias pd, numpy sous l’alias np et matplotlib.pyplot sous l’alias plt ont été importés pour vous, et le DataFrame income de l’exercice précédent est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Importer et gérer des données financières en Python
Instructions
- Générez les pourcentages de 10 % à 90 % par incréments de 10 % avec
np.arange(), affectez le résultat àquantiles, puis affichez-le. - À l’aide de
quantileset de.quantile(), calculez les déciles du revenu par habitant sous le nomdeciles, et affichez le résultat. - Tracez et affichez le résultat sous forme de diagramme en barres, avec
plt.tight_layout(). Donnez-lui le titre'Global Income per Capita - Deciles'.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate range of deciles
quantiles = ____
# Print them
print(quantiles)
# Calculate deciles for 'Income per Capita'
deciles = ____.quantile(____)
# Print them
print(deciles)
# Plot deciles as a bar chart
deciles.____(____=____, title='Global Income per Capita - Deciles')
# Make sure to use the tight layout!
plt.____()
# Show the plot
plt.show()