Voorkeuren van gebruikers analyseren
Om de echte impact van de bug te begrijpen, is het cruciaal om te bepalen hoeveel abonnees we hadden verwacht als er geen taalbug was geweest. Dit is belangrijk om de omvang van het probleem in te schatten en te bepalen hoe belangrijk het is om dit soort fouten in de toekomst te voorkomen.
In deze stap maak je een nieuw DataFrame waarop je berekeningen kunt uitvoeren om het verwachte aantal abonnees te bepalen. Dit DataFrame bevat per dag hoeveel gebruikers elke taal prefereren. Zodra je het DataFrame hebt, kun je beginnen met berekenen hoeveel abonnees je had mogen verwachten als de taalbug niet was opgetreden.
Deze oefening maakt deel uit van de cursus
Marketingcampagnes analyseren met pandas
Oefeninstructies
- Groepeer
house_adsopdate_servedenlanguage_preferred. - Gebruik een dictionary in een aanroep van
.agg()om het aantal unieke gebruikers te berekenen en het aantal geconverteerde gebruikers op te tellen. - Unstack
convertedoplevel = 1
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Group house_ads by date and language
converted = house_ads.groupby(____)\
.agg({'____':'____',
'____':'____'})
# Unstack converted
converted_df = pd.DataFrame(____.____(____))