CommencerCommencer gratuitement

Discrétisation d’une variable donnée

Pour créer des graphiques d’analyse des prédicteurs pour des variables continues, vous devez d’abord les discrétiser. En Python, vous pouvez discrétiser des colonnes pandas avec la méthode qcut.

Pour vérifier que la variable a été correctement discrétisée, vous pouvez confirmer que les intervalles ont une taille similaire en utilisant la méthode groupby :

print(basetable.groupby("discretized_variable").size()

Cet exercice fait partie du cours

Introduction à l’analytique prédictive en Python

Afficher le cours

Instructions

  • Utilisez la méthode qcut pour discrétiser la variable time_since_last_donation en 10 groupes. Assignez cette variable à une nouvelle colonne appelée "bins_recency".
  • Utilisez la méthode groupby pour vérifier que les intervalles ont à peu près la même taille.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Modifier et exécuter le code