CommencerCommencer gratuitement

Supprimer les doublons

Supposez que vous souhaitiez construire un modèle prédictif afin de sélectionner les donateurs les plus susceptibles de répondre à un courrier. La population de la table de base doit contenir les donateurs ayant une adresse disponible et dont les paramètres de confidentialité autorisent l’envoi d’un courrier. Tous les donateurs candidats sont fournis dans un dataframe donors avec trois colonnes : le donor_id, un indicateur address qui vaut 1 si l’adresse est disponible et 0 sinon, et un indicateur letter_allowed qui vaut 1 si l’on peut envoyer un courrier à ce donateur et 0 sinon. Dans cet exercice, vous allez construire un ensemble contenant les donateurs qui doivent entrer dans la population.

Cet exercice fait partie du cours

Analytique prédictive intermédiaire en Python

Afficher le cours

Instructions

  • Créez un dataframe donors_population ne contenant que les observations pour lesquelles l’adresse est disponible et l’envoi d’un courrier est autorisé.
  • Créez une liste contenant les identifiants de donateurs présents dans donors_population.
  • Construisez la population finale, puis indiquez le nombre de donateurs qu’elle contient.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Modifier et exécuter le code