Analyser les préférences des utilisateurs

Pour mesurer l’impact réel du bug, il est essentiel d’estimer combien d’abonnés nous aurions attendu en l’absence d’erreur de langue. Cela permet d’évaluer l’ampleur du problème et l’importance de prévenir ce type d’erreur à l’avenir.

Dans cette étape, vous allez créer un nouveau DataFrame sur lequel vous pourrez effectuer des calculs pour estimer le nombre attendu d’abonnés. Ce DataFrame indiquera, jour par jour, combien d’utilisateurs préfèrent chaque langue. Une fois ce DataFrame prêt, vous pourrez commencer à calculer combien d’abonnés vous auriez dû obtenir si le bug de langue n’avait pas eu lieu.

Cet exercice fait partie du cours

<cours>Analyzing Marketing Campaigns with pandas</cours>

Voir le cours

Instructions de l’exercice

Regroupez house_ads par date_served et language_preferred.
Utilisez un dictionnaire dans un appel à .agg() pour calculer le nombre d’utilisateurs uniques et sommer le nombre d’utilisateurs convertis.
Faites un unstack de converted avec level = 1

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Group house_ads by date and language
converted = house_ads.groupby(____)\
                        .agg({'____':'____',
                              '____':'____'})

# Unstack converted
converted_df = pd.DataFrame(____.____(____))

Modifier et exécuter le code