Discretizzazione di una certa variabile
Per poter creare predictor insight graphs per variabili continue, devi prima discretizzarle. In Python, puoi discretizzare le colonne di pandas usando il metodo qcut.
Per verificare che la variabile sia stata discretizzata correttamente, puoi controllare che i bin abbiano dimensioni simili usando il metodo groupby:
print(basetable.groupby("discretized_variable").size()
Questo esercizio fa parte del corso
Introduzione alla Predictive Analytics in Python
Istruzioni dell'esercizio
- Usa il metodo
qcutper discretizzare la variabiletime_since_last_donationin 10 gruppi. Assegna questa variabile a una nuova colonna chiamata "bins_recency". - Usa il metodo
groupbyper verificare che i bin abbiano dimensioni più o meno uguali.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())