ComenzarEmpieza gratis

Eliminando objetos duplicados

Supón que quieres construir un modelo predictivo para seleccionar a los donantes con más probabilidad de responder a una carta. La población de la base table debe incluir donantes que tengan una dirección disponible y cuya configuración de privacidad permita enviarles una carta. Todos los donantes candidatos están en un dataframe donors con tres columnas: el donor_id, una bandera address que es 1 si la dirección está disponible y 0 en caso contrario, y una bandera letter_allowed que es 1 si se puede enviar una carta a ese donante y 0 en caso contrario. En este ejercicio vas a construir un conjunto con los donantes que deben entrar en la población.

Este ejercicio forma parte del curso

Análisis predictivo intermedio en Python

Ver curso

Instrucciones del ejercicio

  • Crea un dataframe donors_population que contenga solo observaciones con dirección disponible y para las que esté permitido enviar una carta.
  • Crea una lista con los identificadores de donante en donors_population.
  • Construye la población final y luego el número de donantes que contiene.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Editar y ejecutar código