Netjes indelen
De methode qcut verdeelt de variabele in n_bins gelijke klassen. In sommige gevallen is het echter fijn om je eigen klassen te kiezen. Met de methode cut in Python kun je je eigen klassen instellen.
Deze oefening maakt deel uit van de cursus
Introductie tot Predictive Analytics in Python
Oefeninstructies
- Discretiseer de variabele
number_giftin drie klassen met grenzen 0 en 5, 5 en 10, 10 en 20 en sla deze variabele op in een nieuwe kolomdisc_number_gift. - Tel het aantal observaties in elke groep.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Discretize the variable
basetable["disc_number_gift"] = pd.cut(____[____],[____, ____, ____, ____])
# Count the number of observations per group
print(basetable.groupby("____").____())