CommencerCommencer gratuitement

Calculer le taux de rétention depuis zéro

Vous avez vu comment créer une table de métriques de rétention et de quantité moyenne pour les cohortes d’acquisition mensuelles. C’est maintenant à vous de construire les métriques de rétention par vous-même.

Le jeu de données online a été chargé avec les cohortes mensuelles et l’index de cohorte attribué dans cette leçon. N’hésitez pas à l’afficher dans la Console.

Nous avons également chargé un objet groupby sous forme de DataFrame grouping avec cette commande : grouping = online.groupby(['CohortMonth', 'CohortIndex'])

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Sélectionnez la colonne d’ID client, comptez le nombre de valeurs uniques, enregistrez-le dans cohort_data, puis réinitialisez son index.
  • Créez un pivot avec le mois de cohorte en index, l’index de cohorte en colonnes et l’ID client en valeurs.
  • Sélectionnez la première colonne et stockez-la dans cohort_sizes.
  • Divisez le nombre de la cohorte par la taille des cohortes le long des lignes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count the number of unique values per customer ID
cohort_data = grouping[____].apply(pd.Series.____).reset_index()

# Create a pivot 
cohort_counts = cohort_data.____(index=____, columns=____, values=____)

# Select the first column and store it to cohort_sizes
cohort_sizes = cohort_counts.iloc[:,____]

# Divide the cohort count by cohort sizes along the rows
retention = cohort_counts.____(____, axis=____)
Modifier et exécuter le code