Bereken de retentiegraad vanaf nul
Je hebt gezien hoe je een tabel maakt met retentie- en gemiddelde hoeveelheidsstatistieken voor de maandelijkse acquisitiecohorten. Nu is het jouw beurt om de retentiemetrics zelf te bouwen.
De online-gegevensset is voor je geladen met maandelijkse cohorten en een cohortindex, zoals in deze les is aangemaakt. Voel je vrij om hem in de Console te printen.
Ook hebben we een groupby-object als DataFrame grouping voor je geladen met dit commando:
grouping = online.groupby(['CohortMonth', 'CohortIndex'])
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Selecteer de kolom met klant-ID, tel het aantal unieke waarden, sla dit op als
cohort_dataen reset de index. - Maak een pivot met de maandelijkse cohort in de index, de cohortindex in de kolommen en de klant-ID in de waarden.
- Selecteer de eerste kolom en sla die op in
cohort_sizes. - Deel het aantal per cohort door de cohortgroottes over de rijen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of unique values per customer ID
cohort_data = grouping[____].apply(pd.Series.____).reset_index()
# Create a pivot
cohort_counts = cohort_data.____(index=____, columns=____, values=____)
# Select the first column and store it to cohort_sizes
cohort_sizes = cohort_counts.iloc[:,____]
# Divide the cohort count by cohort sizes along the rows
retention = cohort_counts.____(____, axis=____)