Removendo objetos duplicados
Suponha que você queira construir um modelo preditivo para selecionar os doadores com maior probabilidade de responder a uma carta. A população da base table deve conter doadores que tenham um endereço disponível e que tenham configurações de privacidade que permitam o envio de cartas.
Todos os doadores candidatos estão em um dataframe donors com três colunas: o donor_id, uma flag address que é 1 se o endereço estiver disponível e 0 caso contrário, e uma flag letter_allowed que é 1 se for permitido enviar uma carta a esse doador e 0 caso contrário.
Neste exercício, você vai construir um conjunto com os doadores que devem entrar na população.
Este exercício faz parte do curso
Análise Preditiva Intermediária em Python
Instruções do exercício
- Crie um dataframe
donors_populationcontendo apenas observações com endereço disponível e para as quais o envio de carta é permitido. - Crie uma lista contendo os ids dos doadores em
donors_population. - Construa a população final e depois o número de doadores nela.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]
# Create a list of donor IDs
population_list = ____(____["____"])
# Select unique donors in population_list
population = ____(____)
print(len(population))