ComeçarComece de graça

Criando uma dummy de valor ausente

Dado um basetable que tem uma variável preditiva "total_donations", com o total de doações que um doador já fez. Essa variável pode ter valores ausentes, indicando que esse doador nunca fez uma doação antes. Isso é uma informação importante por si só, então é adequado criar uma variável "no_donations" que indique se "total_donations" está ausente.

Este exercício faz parte do curso

Análise Preditiva Intermediária em Python

Ver curso

Instruções do exercício

  • Crie uma nova coluna "no_donations" em basetable que tenha valor 1 se total_donations estiver ausente e 0 caso contrário.
  • Calcule o número de valores ausentes em total_donations e atribua a number_na.
  • Imprima a porcentagem de valores ausentes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])

# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)

# Calculate percentage of missing values
print(round(____ / ____(____), 2))
Editar e executar o código