Gevoeligheden van het conversiepercentage
Om wat afwisseling te brengen, ga je in de komende oefeningen aan de slag met de conversiemetriek die we in Hoofdstuk Eén hebben verkend. Je bekijkt specifiek wat die waarde wordt bij verschillende procentuele lifts en hoeveel extra conversies per dag die verandering zou opleveren. Eerst bepaal je het gemiddelde aantal paywallweergaven en aankopen dat per dag in onze geobserveerde steekproef is gedaan. Succes!
Deze oefening maakt deel uit van de cursus
Customer Analytics and A/B Testing in Python
Oefeninstructies
- Merge de tabellen
paywall_viewsendemographics_datamet een'inner'join. Dit beperkt het resultaat tot alleen gebruikers die in beide voorkomen en verwijdert iedereen die geen paywall heeft bekeken, wat precies is wat we hier willen. - Groepeer
purchase_dataop'date'. Het resultaat hiervan wordt vervolgens voor je geaggregeerd door te sommeren over het veldpurchaseom het totale aantal aankopen te vinden en te tellen om het totale aantal paywallweergaven te bepalen. - Neem het gemiddelde van elk van de resulterende
sum- encount-velden om het gemiddelde aantal aankopen en paywallweergaven per dag te vinden. - De resultaten weerspiegelen een steekproef van 0,1% van onze totale populatie voor het gebruiksgemak. Vermenigvuldig zowel
daily_purchasesalsdaily_paywall_viewsmet1000zodat ons resultaat de orde van grootte weergeeft alsof we de volledige populatie hadden geobserveerd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Merge and group the datasets
purchase_data = demographics_data.merge(paywall_views, how='____', on=['uid'])
purchase_data.date = purchase_data.date.dt.floor('d')
# Group and aggregate our combined dataset
daily_purchase_data = purchase_data.groupby(by=['____'], as_index=False)
daily_purchase_data = daily_purchase_data.agg({'purchase': ['sum', 'count']})
# Find the mean of each field and then multiply by 1000 to scale the result
daily_purchases = daily_purchase_data.purchase['sum'].____()
daily_paywall_views = daily_purchase_data.purchase['count'].____()
daily_purchases = daily_purchases * ____
daily_paywall_views = daily_paywall_views * ____
print(daily_purchases)
print(daily_paywall_views)