Netjes indelen
De methode qcut verdeelt de variabele in n_bins gelijke klassen. In sommige gevallen is het echter fijn om je eigen klassen te kiezen. Met de methode cut in Python kun je je eigen klassen instellen.
Deze oefening maakt deel uit van de cursus
Introductie tot Predictive Analytics in Python
Oefeninstructies
- Discretiseer de variabele
number_giftin drie klassen met grenzen 0 en 5, 5 en 10, 10 en 20 en sla deze variabele op in een nieuwe kolomdisc_number_gift. - Tel het aantal observaties in elke groep.
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Discretize the variable
basetable["disc_number_gift"] = pd.cut(____[____],[____, ____, ____, ____])
# Count the number of observations per group
print(basetable.groupby("____").____())