Des découpages propres
La méthode qcut divise la variable en n_bins intervalles de taille égale. Dans certains cas, il est toutefois préférable de définir vos propres intervalles. La méthode cut en Python vous permet de choisir vos propres bornes.
Cet exercice fait partie du cours
<cours>Introduction à l’analytique prédictive en Python</cours>Instructions de l’exercice
- Discrétisez la variable
number_giften trois intervalles avec les bornes 0 à 5, 5 à 10, et 10 à 20, puis assignez cette variable à une nouvelle colonne appeléedisc_number_gift. - Comptez le nombre d’observations dans chaque groupe.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Discretize the variable
basetable["disc_number_gift"] = pd.cut(____[____],[____, ____, ____, ____])
# Count the number of observations per group
print(basetable.groupby("____").____())