Calculer le taux de rétention depuis zéro

Vous avez vu comment créer une table de métriques de rétention et de quantité moyenne pour les cohortes d’acquisition mensuelles. C’est maintenant à vous de construire les métriques de rétention par vous-même.

Le jeu de données online a été chargé avec les cohortes mensuelles et l’index de cohorte attribué dans cette leçon. N’hésitez pas à l’afficher dans la Console.

Nous avons également chargé un objet groupby sous forme de DataFrame grouping avec cette commande : grouping = online.groupby(['CohortMonth', 'CohortIndex'])

Cet exercice fait partie du cours

<cours>Customer Segmentation in Python</cours>

Voir le cours

Instructions de l’exercice

Sélectionnez la colonne d’ID client, comptez le nombre de valeurs uniques, enregistrez-le dans cohort_data, puis réinitialisez son index.
Créez un pivot avec le mois de cohorte en index, l’index de cohorte en colonnes et l’ID client en valeurs.
Sélectionnez la première colonne et stockez-la dans cohort_sizes.
Divisez le nombre de la cohorte par la taille des cohortes le long des lignes.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Count the number of unique values per customer ID
cohort_data = grouping[____].apply(pd.Series.____).reset_index()

# Create a pivot 
cohort_counts = cohort_data.____(index=____, columns=____, values=____)

# Select the first column and store it to cohort_sizes
cohort_sizes = cohort_counts.iloc[:,____]

# Divide the cohort count by cohort sizes along the rows
retention = cohort_counts.____(____, axis=____)

Modifier et exécuter le code