Eliminando objetos duplicados
Supón que quieres construir un modelo predictivo para seleccionar a los donantes con más probabilidad de responder a una carta. La población de la base table debe incluir donantes que tengan una dirección disponible y cuya configuración de privacidad permita enviarles una carta.
Todos los donantes candidatos están en un dataframe donors con tres columnas: el donor_id, una bandera address que es 1 si la dirección está disponible y 0 en caso contrario, y una bandera letter_allowed que es 1 si se puede enviar una carta a ese donante y 0 en caso contrario.
En este ejercicio vas a construir un conjunto con los donantes que deben entrar en la población.
Este ejercicio forma parte del curso
Análisis predictivo intermedio en Python
Instrucciones del ejercicio
- Crea un dataframe
donors_populationque contenga solo observaciones con dirección disponible y para las que esté permitido enviar una carta. - Crea una lista con los identificadores de donante en
donors_population. - Construye la población final y luego el número de donantes que contiene.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]
# Create a list of donor IDs
population_list = ____(____["____"])
# Select unique donors in population_list
population = ____(____)
print(len(population))