IniziaInizia gratis

Discretizzazione di una certa variabile

Per poter creare predictor insight graphs per variabili continue, devi prima discretizzarle. In Python, puoi discretizzare le colonne di pandas usando il metodo qcut.

Per verificare che la variabile sia stata discretizzata correttamente, puoi controllare che i bin abbiano dimensioni simili usando il metodo groupby:

print(basetable.groupby("discretized_variable").size()

Questo esercizio fa parte del corso

Introduzione alla Predictive Analytics in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Usa il metodo qcut per discretizzare la variabile time_since_last_donation in 10 gruppi. Assegna questa variabile a una nuova colonna chiamata "bins_recency".
  • Usa il metodo groupby per verificare che i bin abbiano dimensioni più o meno uguali.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Modifica ed esegui il codice