CommencerCommencer gratuitement

Déciles de la distribution mondiale des revenus

Un décile est un type particulier de quantile obtenu en divisant la distribution d’un jeu de données en dix parts. Les déciles (comme tout autre type de quantile) peuvent être créés en fournissant la fonction numpy suivante à .quantile(), où start est le début de l’intervalle (inclusif), stop est la fin de l’intervalle (exclusif) et step est l’écart entre deux valeurs adjacentes :

np.arange(start, stop, step)

Comme vous l’avez vu dans la vidéo, un histogramme standard est un excellent moyen de visualiser la distribution des données. Vous pouvez en créer un en ajoutant kind='bar' comme argument à .plot().

À vous de jouer : appliquez cela pour tracer un résumé de la distribution des revenus par déciles ! pandas sous l’alias pd, numpy sous l’alias np et matplotlib.pyplot sous l’alias plt ont été importés pour vous, et le DataFrame income de l’exercice précédent est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Importer et gérer des données financières en Python

Afficher le cours

Instructions

  • Générez les pourcentages de 10 % à 90 % par incréments de 10 % avec np.arange(), affectez le résultat à quantiles, puis affichez-le.
  • À l’aide de quantiles et de .quantile(), calculez les déciles du revenu par habitant sous le nom deciles, et affichez le résultat.
  • Tracez et affichez le résultat sous forme de diagramme en barres, avec plt.tight_layout(). Donnez-lui le titre 'Global Income per Capita - Deciles'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate range of deciles
quantiles = ____

# Print them
print(quantiles)

# Calculate deciles for 'Income per Capita'
deciles = ____.quantile(____)

# Print them
print(deciles)

# Plot deciles as a bar chart
deciles.____(____=____, title='Global Income per Capita - Deciles')

# Make sure to use the tight layout!
plt.____()

# Show the plot
plt.show()
Modifier et exécuter le code