pandas-functies effectief gebruiken
Je bouwt een Python-toepassing die samenvattende statistieken berekent op basis van door de gebruiker gekozen variabelen. De volledige gegevensset is behoorlijk groot. Voor nu zet je je code op met een deel van de gegevensset, vooraf geladen als adult. Terwijl je een herbruikbaar proces maakt, denk je na over de meest efficiënte manier om het GroupBy-object op te zetten.
Deze oefening maakt deel uit van de cursus
Werken met categorische data in Python
Oefeninstructies
- Maak een lijst met de namen van twee door de gebruiker gekozen variabelen:
"Education"en"Above/Below 50k". - Maak een
GroupBy-object,gb, metuser_listals groeperingsvariabelen. - Bereken het gemiddelde van
"Hours/Week"per groep met de meest efficiënte aanpak die in de video is behandeld.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a list of user-selected variables
user_list = ____
# Create a GroupBy object using this list
gb = ____
# Find the mean for the variable "Hours/Week" for each group - Be efficient!
print(____)