Dubbele objecten verwijderen
Stel dat je een voorspellend model wilt bouwen om de donoren te selecteren die het meest waarschijnlijk op een brief reageren. De populatie van de basistabel moet donoren bevatten die een adres beschikbaar hebben en waarvan de privacy-instellingen toestaan dat je ze een brief stuurt.
Alle kandidaat-donoren staan in een dataframe donors met drie kolommen: de donor_id, een vlag address die 1 is als het adres beschikbaar is en 0 anders, en een vlag letter_allowed die 1 is als je deze donor een brief mag sturen en 0 anders.
In deze oefening maak je een set met de donoren die in de populatie moeten komen.
Deze oefening maakt deel uit van de cursus
Gevorderde voorspellende analyse in Python
Oefeninstructies
- Maak een dataframe
donors_populationdat alleen observaties bevat met een beschikbaar adres en waarvoor een brief is toegestaan. - Maak een lijst met de donor-id's in
donors_population. - Stel de uiteindelijke populatie samen en bepaal vervolgens het aantal donoren daarin.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]
# Create a list of donor IDs
population_list = ____(____["____"])
# Select unique donors in population_list
population = ____(____)
print(len(population))