Crear una variable indicadora de valores faltantes
Dado un basetable que tiene una variable predictora "total_donations" con el número total de donaciones que un donante ha hecho. Esta variable puede tener valores faltantes, lo que indica que ese donante nunca ha hecho una donación antes. Esta es información importante por sí misma, así que conviene crear una variable "no_donations" que indique si "total_donations" falta.
Este ejercicio forma parte del curso
Análisis predictivo intermedio en Python
Instrucciones del ejercicio
- Crea una nueva columna "no_donations" en
basetableque tome el valor 1 sitotal_donationsfalta y 0 en caso contrario. - Calcula el número de valores faltantes en
total_donationsy asígnalo anumber_na. - Imprime el porcentaje de valores faltantes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])
# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)
# Calculate percentage of missing values
print(round(____ / ____(____), 2))