Benoemde aggregaties
Je hebt gezien hoe .groupby() en .agg() gecombineerd kunnen worden om samenvattingen per categorie te tonen. Soms is het handig om nieuwe kolommen een naam te geven bij het aggregeren, zodat in de uitvoer van de code duidelijk is welke aggregaties worden toegepast en waar.
Jouw taak is om een DataFrame continent_summary te maken met één rij per continent. De kolommen van het DataFrame bevatten het gemiddelde werkloosheidspercentage per continent in 2021 en de standaarddeviatie van het werkloosheidspercentage in 2021. En natuurlijk hernoem je de kolommen zodat hun inhoud duidelijk is!
Het unemployment DataFrame is beschikbaar en pandas is geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Oefeninstructies
- Maak een kolom
mean_rate_2021die het gemiddelde werkloosheidspercentage in 2021 per continent laat zien. - Maak een kolom
std_rate_2021die de standaarddeviatie van het werkloosheidspercentage in 2021 per continent laat zien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
continent_summary = unemployment.groupby("continent").agg(
# Create the mean_rate_2021 column
____=____,
# Create the std_rate_2021 column
____=____
)
print(continent_summary)