ComeçarComece de graça

Removendo objetos duplicados

Suponha que você queira construir um modelo preditivo para selecionar os doadores com maior probabilidade de responder a uma carta. A população da base table deve conter doadores que tenham um endereço disponível e que tenham configurações de privacidade que permitam o envio de cartas. Todos os doadores candidatos estão em um dataframe donors com três colunas: o donor_id, uma flag address que é 1 se o endereço estiver disponível e 0 caso contrário, e uma flag letter_allowed que é 1 se for permitido enviar uma carta a esse doador e 0 caso contrário. Neste exercício, você vai construir um conjunto com os doadores que devem entrar na população.

Este exercício faz parte do curso

Análise Preditiva Intermediária em Python

Ver curso

Instruções do exercício

  • Crie um dataframe donors_population contendo apenas observações com endereço disponível e para as quais o envio de carta é permitido.
  • Crie uma lista contendo os ids dos doadores em donors_population.
  • Construa a população final e depois o número de doadores nela.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Editar e executar o código