CommencerCommencer gratuitement

Créer un DataFrame pour les house ads

L’équipe en charge des house ads est inquiète, car elle a constaté une baisse soudaine du taux de conversion ces dernières semaines. Dans les exercices précédents, vous avez confirmé que la conversion est en baisse après avoir observé un schéma lié aux préférences de langue.

En tant que data scientist, votre rôle est de fournir à vos interlocuteurs marketing un retour aussi précis que possible sur ce qui n’a pas fonctionné, afin de maximiser leurs chances de corriger le problème. Il est essentiel de ne pas simplement dire « il semble y avoir un problème de langue », mais d’identifier précisément la nature du problème pour éviter que l’équipe ne répète la même erreur.

Cet exercice fait partie du cours

Analyzing Marketing Campaigns with pandas

Afficher le cours

Instructions

  • Utilisez np.where() pour créer une nouvelle colonne dans house_ads appelée 'is_correct_lang' dont les valeurs sont 'Yes' si 'language_displayed' est égal à 'language_preferred' et 'No' sinon.
  • Regroupez par date_served et is_correct_lang pour obtenir un décompte quotidien des annonces diffusées.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add the new column is_correct_lang
house_ads['is_correct_lang'] = np.____(
    house_ads['____'] == house_ads['____'], 
    '____', 
    '____')

# Groupby date_served and correct_language
language_check = house_ads.____(____)['____'].____()

# Unstack language_check and fill missing values with 0's
language_check_df = pd.DataFrame(language_check.unstack(level=1)).fillna(0)

# Print results
print(language_check_df)
Modifier et exécuter le code