Aan de slagGa gratis aan de slag

pandas-functies effectief gebruiken

Je bouwt een Python-toepassing die samenvattende statistieken berekent op basis van door de gebruiker gekozen variabelen. De volledige gegevensset is behoorlijk groot. Voor nu zet je je code op met een deel van de gegevensset, vooraf geladen als adult. Terwijl je een herbruikbaar proces maakt, denk je na over de meest efficiënte manier om het GroupBy-object op te zetten.

Deze oefening maakt deel uit van de cursus

Werken met categorische data in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijst met de namen van twee door de gebruiker gekozen variabelen: "Education" en "Above/Below 50k".
  • Maak een GroupBy-object, gb, met user_list als groeperingsvariabelen.
  • Bereken het gemiddelde van "Hours/Week" per groep met de meest efficiënte aanpak die in de video is behandeld.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a list of user-selected variables
user_list = ____

# Create a GroupBy object using this list
gb = ____

# Find the mean for the variable "Hours/Week" for each group - Be efficient!
print(____)
Code bewerken en uitvoeren