Regrouper et agréger
Vous utiliserez souvent .groupby() et .agg() dans ce cours, il est donc important de vous y habituer. Dans cet exercice, votre tâche est de calculer un ensemble de statistiques récapitulatives sur les achats, ventilées par 'device' (Android ou iOS) et par 'gender' (Male ou Female).
Ensuite, vous comparerez les valeurs entre ces sous-ensembles, ce qui vous donnera une base de référence pour ces valeurs en tant que KPI potentiels à optimiser par la suite.
Le DataFrame purchase_data de l’exercice précédent a été préchargé pour vous. Pour rappel, il contient les achats fusionnés avec les données démographiques des utilisateurs.
Cet exercice fait partie du cours
Analytics client et A/B Testing en Python
Instructions
- Regroupez le DataFrame
purchase_datapar'device'puis'gender', dans cet ordre. - Agrégez
grouped_purchase_dataen calculant, dans cet ordre, la'mean', la'median'et l’écart type ('std') du prix d’achat pour chaque groupe. - Examinez les résultats. La moyenne diffère‑t‑elle fortement de la médiane ? Quelle est l’ampleur de la variabilité dans chaque groupe ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group the data
grouped_purchase_data = purchase_data.____(____ = ['____', '____'])
# Aggregate the data
purchase_summary = grouped_purchase_data.____({'price': ['____', '____', '____']})
# Examine the results
print(purchase_summary)