Aan de slagGa gratis aan de slag

Benoemde aggregaties

Je hebt gezien hoe .groupby() en .agg() gecombineerd kunnen worden om samenvattingen per categorie te tonen. Soms is het handig om nieuwe kolommen een naam te geven bij het aggregeren, zodat in de uitvoer van de code duidelijk is welke aggregaties worden toegepast en waar.

Jouw taak is om een DataFrame continent_summary te maken met één rij per continent. De kolommen van het DataFrame bevatten het gemiddelde werkloosheidspercentage per continent in 2021 en de standaarddeviatie van het werkloosheidspercentage in 2021. En natuurlijk hernoem je de kolommen zodat hun inhoud duidelijk is!

Het unemployment DataFrame is beschikbaar en pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Exploratory Data Analysis in Python

Cursus bekijken

Oefeninstructies

  • Maak een kolom mean_rate_2021 die het gemiddelde werkloosheidspercentage in 2021 per continent laat zien.
  • Maak een kolom std_rate_2021 die de standaarddeviatie van het werkloosheidspercentage in 2021 per continent laat zien.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

continent_summary = unemployment.groupby("continent").agg(
    # Create the mean_rate_2021 column
    ____=____,
    # Create the std_rate_2021 column
    ____=____
)
print(continent_summary)
Code bewerken en uitvoeren