CommencerCommencer gratuitement

Regrouper et agréger

Vous utiliserez souvent .groupby() et .agg() dans ce cours, il est donc important de vous y habituer. Dans cet exercice, votre tâche est de calculer un ensemble de statistiques récapitulatives sur les achats, ventilées par 'device' (Android ou iOS) et par 'gender' (Male ou Female).

Ensuite, vous comparerez les valeurs entre ces sous-ensembles, ce qui vous donnera une base de référence pour ces valeurs en tant que KPI potentiels à optimiser par la suite.

Le DataFrame purchase_data de l’exercice précédent a été préchargé pour vous. Pour rappel, il contient les achats fusionnés avec les données démographiques des utilisateurs.

Cet exercice fait partie du cours

Analytics client et A/B Testing en Python

Afficher le cours

Instructions

  • Regroupez le DataFrame purchase_data par 'device' puis 'gender', dans cet ordre.
  • Agrégez grouped_purchase_data en calculant, dans cet ordre, la 'mean', la 'median' et l’écart type ('std') du prix d’achat pour chaque groupe.
  • Examinez les résultats. La moyenne diffère‑t‑elle fortement de la médiane ? Quelle est l’ampleur de la variabilité dans chaque groupe ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Group the data 
grouped_purchase_data = purchase_data.____(____ = ['____', '____'])

# Aggregate the data
purchase_summary = grouped_purchase_data.____({'price': ['____', '____', '____']})

# Examine the results
print(purchase_summary)
Modifier et exécuter le code