Analyser les préférences des utilisateurs
Pour mesurer l’impact réel du bug, il est essentiel d’estimer combien d’abonnés nous aurions attendu en l’absence d’erreur de langue. Cela permet d’évaluer l’ampleur du problème et l’importance de prévenir ce type d’erreur à l’avenir.
Dans cette étape, vous allez créer un nouveau DataFrame sur lequel vous pourrez effectuer des calculs pour estimer le nombre attendu d’abonnés. Ce DataFrame indiquera, jour par jour, combien d’utilisateurs préfèrent chaque langue. Une fois ce DataFrame prêt, vous pourrez commencer à calculer combien d’abonnés vous auriez dû obtenir si le bug de langue n’avait pas eu lieu.
Cet exercice fait partie du cours
Analyzing Marketing Campaigns with pandas
Instructions
- Regroupez
house_adspardate_servedetlanguage_preferred. - Utilisez un dictionnaire dans un appel à
.agg()pour calculer le nombre d’utilisateurs uniques et sommer le nombre d’utilisateurs convertis. - Faites un unstack de
convertedaveclevel = 1
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group house_ads by date and language
converted = house_ads.groupby(____)\
.agg({'____':'____',
'____':'____'})
# Unstack converted
converted_df = pd.DataFrame(____.____(____))