Discrétisation d’une variable donnée
Pour créer des graphiques d’analyse des prédicteurs pour des variables continues, vous devez d’abord les discrétiser. En Python, vous pouvez discrétiser des colonnes pandas avec la méthode qcut.
Pour vérifier que la variable a été correctement discrétisée, vous pouvez confirmer que les intervalles ont une taille similaire en utilisant la méthode groupby :
print(basetable.groupby("discretized_variable").size()
Cet exercice fait partie du cours
Introduction à l’analytique prédictive en Python
Instructions
- Utilisez la méthode
qcutpour discrétiser la variabletime_since_last_donationen 10 groupes. Assignez cette variable à une nouvelle colonne appelée "bins_recency". - Utilisez la méthode
groupbypour vérifier que les intervalles ont à peu près la même taille.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())