Wereldwijde inkomens: Spreiding
Een kwantiel is een maat voor spreiding die ontstaat door een frequentieverdeling van een DataFrame in gelijke groepen te verdelen. Je kunt waarden op het gegeven kwantiel q van een DataFrame df opvragen met het commando df.quantile(q); als je een lijst meegeeft als q, krijg je een waarde voor elk opgegeven kwantiel.
Hier ga je verder met je analyse van de wereldwijde inkomensverdeling met twee maten voor spreiding: de standaardafwijking, of de vierkantswortel van de variantie, en de interkwartielafstand (IQR).
pandas is geïmporteerd als pd, en het income DataFrame uit de vorige oefening staat in je werkruimte.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Bereken met de juiste functies het gemiddelde van income per capita als
meanen de standaardafwijking alsstd. - Zonder
.quantile()te gebruiken, bereken en print je de onder- en bovengrens van een interval van één standaardafwijking rond het gemiddelde in een lijstbounds:- trek
stdaf vanmeanals eerste element - tel
stdop bijmeanals tweede element
- trek
- Gebruik
.quantile()en een lijst met twee geschikte decimale waarden om het eerste en derde kwartiel van'Income per Capita'te berekenen en te printen alsquantiles. Komen de waarden overeen? - Bereken en print de IQR,
iqr, met de eenvoudige aftrekexpressie die je in de video hebt geleerd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate mean
mean = ____
# Calculate standard deviation
std = income['Income per Capita'].std()
# Calculate and print lower and upper bounds
bounds = [____, ____]
print(bounds)
# Calculate and print first and third quartiles
quantiles = income['Income per Capita'].____([____, ____])
print(quantiles)
# Calculate and print IQR
iqr = ____ - ____
print(iqr)