Aan de slagGa gratis aan de slag

Groeperen & aggregeren

Je gaat .groupby() en .agg() vaak gebruiken in deze cursus, dus het is belangrijk dat je er vertrouwd mee raakt. In deze oefening bereken je een set samenvattende statistieken over de aankoopgegevens, uitgesplitst naar 'device' (Android of iOS) en 'gender' (Male of Female).

Daarna vergelijk je de waarden tussen deze subsets. Dat geeft je een basislijn voor deze waarden als mogelijke KPI’s om verder te optimaliseren.

De DataFrame purchase_data uit de vorige oefening is alvast voor je ingeladen. Ter herinnering: deze bevat aankopen die zijn samengevoegd met demografische gegevens van gebruikers.

Deze oefening maakt deel uit van de cursus

Customer Analytics and A/B Testing in Python

Cursus bekijken

Oefeninstructies

  • Groepeer de DataFrame purchase_data op 'device' en 'gender', in die volgorde.
  • Aggregeer grouped_purchase_data en bereken in die volgorde de 'mean', 'median' en de standaarddeviatie ('std') van de aankoopprijs binnen deze groepen.
  • Bekijk de resultaten. Verschilt het gemiddelde sterk van de mediaan? Hoeveel variatie is er in elke groep?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Group the data 
grouped_purchase_data = purchase_data.____(____ = ['____', '____'])

# Aggregate the data
purchase_summary = grouped_purchase_data.____({'price': ['____', '____', '____']})

# Examine the results
print(purchase_summary)
Code bewerken en uitvoeren