Decielen van de mondiale inkomensverdeling
Een deciel is een speciaal type kwantiel dat je krijgt door de verdeling van een gegevensset in tien gelijke delen te verdelen. Decielen (net als andere soorten kwantielen) kun je maken door de volgende numpy-functie aan .quantile() te geven, waarbij start het begin van het interval is (inclusief), stop het einde van het interval (exclusief) en step de afstand tussen twee opeenvolgende waarden:
np.arange(start, stop, step)
Zoals je in de video zag, is een standaard staafdiagram een prima manier om de verdeling van data te visualiseren. Je maakt er een door kind='bar' als argument toe te voegen aan .plot().
Nu ben jij aan de beurt om deze kennis toe te passen en een samenvatting van de inkomensverdeling in decielen te plotten! pandas als pd, numpy als np en matplotlib.pyplot als plt zijn al voor je geïmporteerd, en de DataFrame income uit de vorige oefening is beschikbaar in je workspace.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Genereer de percentages van 10% tot en met 90% in stappen van 10% met
np.arange(), ken het resultaat toe aanquantilesen print het. - Gebruik
quantilesen.quantile()om de decielen voor het inkomen per hoofd van de bevolking te berekenen alsdeciles, en print het resultaat. - Plot en toon het resultaat als een staafdiagram met
plt.tight_layout(). Geef het de titel'Global Income per Capita - Deciles'.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate range of deciles
quantiles = ____
# Print them
print(quantiles)
# Calculate deciles for 'Income per Capita'
deciles = ____.quantile(____)
# Print them
print(deciles)
# Plot deciles as a bar chart
deciles.____(____=____, title='Global Income per Capita - Deciles')
# Make sure to use the tight layout!
plt.____()
# Show the plot
plt.show()