Des découpages propres
La méthode qcut divise la variable en n_bins intervalles de taille égale. Dans certains cas, il est toutefois préférable de définir vos propres intervalles. La méthode cut en Python vous permet de choisir vos propres bornes.
Cet exercice fait partie du cours
Introduction à l’analytique prédictive en Python
Instructions
- Discrétisez la variable
number_giften trois intervalles avec les bornes 0 à 5, 5 à 10, et 10 à 20, puis assignez cette variable à une nouvelle colonne appeléedisc_number_gift. - Comptez le nombre d’observations dans chaque groupe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Discretize the variable
basetable["disc_number_gift"] = pd.cut(____[____],[____, ____, ____, ____])
# Count the number of observations per group
print(basetable.groupby("____").____())