Rimozione di oggetti duplicati
Supponi di voler costruire un modello predittivo per selezionare i donatori con la maggiore probabilità di rispondere a una lettera. La popolazione della base table dovrebbe includere donatori che hanno un indirizzo disponibile e impostazioni sulla privacy che consentano l’invio di una lettera.
Tutti i donatori candidati sono forniti in un dataframe donors con tre colonne: donor_id, un flag address che vale 1 se l’indirizzo è disponibile e 0 altrimenti, e un flag letter_allowed che vale 1 se è possibile inviare a quel donatore una lettera e 0 altrimenti.
In questo esercizio costruirai un insieme dei donatori che devono entrare nella popolazione.
Questo esercizio fa parte del corso
Analisi predittiva intermedia in Python
Istruzioni dell'esercizio
- Crea un dataframe
donors_populationcontenente solo le osservazioni con indirizzo disponibile e per cui è consentito inviare una lettera. - Crea una lista contenente gli id dei donatori in
donors_population. - Costruisci la popolazione finale e poi il numero di donatori in essa.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]
# Create a list of donor IDs
population_list = ____(____["____"])
# Select unique donors in population_list
population = ____(____)
print(len(population))