Discretización de una variable concreta
Para crear predictor insight graphs de variables continuas, primero necesitas discretizarlas. En Python, puedes discretizar columnas de pandas usando el método qcut.
Para comprobar si la variable se discretizó correctamente, puedes verificar que los intervalos tengan un tamaño similar usando el método groupby:
print(basetable.groupby("discretized_variable").size()
Este ejercicio forma parte del curso
Introducción al análisis predictivo en Python
Instrucciones del ejercicio
- Usa el método
qcutpara discretizar la variabletime_since_last_donationen 10 grupos. Asigna esta variable a una nueva columna llamada "bins_recency". - Usa el método
groupbypara verificar que los intervalos tengan aproximadamente el mismo tamaño.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())