Calculer le taux de rétention depuis zéro
Vous avez vu comment créer une table de métriques de rétention et de quantité moyenne pour les cohortes d’acquisition mensuelles. C’est maintenant à vous de construire les métriques de rétention par vous-même.
Le jeu de données online a été chargé avec les cohortes mensuelles et l’index de cohorte attribué dans cette leçon. N’hésitez pas à l’afficher dans la Console.
Nous avons également chargé un objet groupby sous forme de DataFrame grouping avec cette commande :
grouping = online.groupby(['CohortMonth', 'CohortIndex'])
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Sélectionnez la colonne d’ID client, comptez le nombre de valeurs uniques, enregistrez-le dans
cohort_data, puis réinitialisez son index. - Créez un pivot avec le mois de cohorte en index, l’index de cohorte en colonnes et l’ID client en valeurs.
- Sélectionnez la première colonne et stockez-la dans
cohort_sizes. - Divisez le nombre de la cohorte par la taille des cohortes le long des lignes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the number of unique values per customer ID
cohort_data = grouping[____].apply(pd.Series.____).reset_index()
# Create a pivot
cohort_counts = cohort_data.____(index=____, columns=____, values=____)
# Select the first column and store it to cohort_sizes
cohort_sizes = cohort_counts.iloc[:,____]
# Divide the cohort count by cohort sizes along the rows
retention = cohort_counts.____(____, axis=____)