Bereken de retentiegraad vanaf nul

Je hebt gezien hoe je een tabel maakt met retentie- en gemiddelde hoeveelheidsstatistieken voor de maandelijkse acquisitiecohorten. Nu is het jouw beurt om de retentiemetrics zelf te bouwen.

De online-gegevensset is voor je geladen met maandelijkse cohorten en een cohortindex, zoals in deze les is aangemaakt. Voel je vrij om hem in de Console te printen.

Ook hebben we een groupby-object als DataFrame grouping voor je geladen met dit commando: grouping = online.groupby(['CohortMonth', 'CohortIndex'])

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Selecteer de kolom met klant-ID, tel het aantal unieke waarden, sla dit op als cohort_data en reset de index.
Maak een pivot met de maandelijkse cohort in de index, de cohortindex in de kolommen en de klant-ID in de waarden.
Selecteer de eerste kolom en sla die op in cohort_sizes.
Deel het aantal per cohort door de cohortgroottes over de rijen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Count the number of unique values per customer ID
cohort_data = grouping[____].apply(pd.Series.____).reset_index()

# Create a pivot 
cohort_counts = cohort_data.____(index=____, columns=____, values=____)

# Select the first column and store it to cohort_sizes
cohort_sizes = cohort_counts.iloc[:,____]

# Divide the cohort count by cohort sizes along the rows
retention = cohort_counts.____(____, axis=____)

Code bewerken en uitvoeren