Criando uma dummy de valor ausente
Dado um basetable que tem uma variável preditiva "total_donations", com o total de doações que um doador já fez. Essa variável pode ter valores ausentes, indicando que esse doador nunca fez uma doação antes. Isso é uma informação importante por si só, então é adequado criar uma variável "no_donations" que indique se "total_donations" está ausente.
Este exercício faz parte do curso
Análise Preditiva Intermediária em Python
Instruções do exercício
- Crie uma nova coluna "no_donations" em
basetableque tenha valor 1 setotal_donationsestiver ausente e 0 caso contrário. - Calcule o número de valores ausentes em
total_donationse atribua anumber_na. - Imprima a porcentagem de valores ausentes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])
# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)
# Calculate percentage of missing values
print(round(____ / ____(____), 2))