Aan de slagGa gratis aan de slag

Dubbele objecten verwijderen

Stel dat je een voorspellend model wilt bouwen om de donoren te selecteren die het meest waarschijnlijk op een brief reageren. De populatie van de basistabel moet donoren bevatten die een adres beschikbaar hebben en waarvan de privacy-instellingen toestaan dat je ze een brief stuurt. Alle kandidaat-donoren staan in een dataframe donors met drie kolommen: de donor_id, een vlag address die 1 is als het adres beschikbaar is en 0 anders, en een vlag letter_allowed die 1 is als je deze donor een brief mag sturen en 0 anders. In deze oefening maak je een set met de donoren die in de populatie moeten komen.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Cursus bekijken

Oefeninstructies

  • Maak een dataframe donors_population dat alleen observaties bevat met een beschikbaar adres en waarvoor een brief is toegestaan.
  • Maak een lijst met de donor-id's in donors_population.
  • Stel de uiteindelijke populatie samen en bepaal vervolgens het aantal donoren daarin.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Code bewerken en uitvoeren