De internationale inkomensverdeling visualiseren
seaborn is een Python-visualisatiebibliotheek voor statistische datavisualisatie, gebaseerd op matplotlib.
Standaard maakt de functie distplot() in het pakket seaborn een histogram, waarbij gegevens in intervallen worden gegroepeerd en als balken worden weergegeven, en wordt een kernel density estimation (KDE), ofwel een gesmoothte histogram, gefit. Je kunt distplot() ook gebruiken om een ander soort grafiek te maken, een rugplot, die markeringen onderaan de grafiek toevoegt om de dichtheid van observaties langs de x-as aan te geven.
seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, ...)
In eerdere oefeningen heb je een kwantielplot gemaakt die een vrij gedetailleerd beeld gaf van het inkomensniveau per hoofd van de bevolking op verschillende punten in de verdeling. Hier gebruik je distplot() om het complete plaatje te krijgen!
pandas is geïmporteerd als pd, en de DataFrame income uit de vorige oefening is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Importeer
seabornalssnsenmatplotlib.pyplotalsplt. - Print de samenvattende statistieken met
.describe(). - Plot en toon een basis-histogram van de kolom
'Income per Capita'met.distplot(). - Maak en toon een rugplot van dezelfde data door de extra argumenten
binsgelijk aan 50,kdeopFalseenrugopTruete zetten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import seaborn and matplotlib
____
____
# Print the summary statistics for income
print(____.____())
# Plot a basic histogram of income per capita
____
# Show the plot
plt.show()
# Plot a rugplot
sns.distplot(income['Income per Capita'], ____, ____, ____)
# Show the plot
plt.show()