ComenzarEmpieza gratis

Crear una variable indicadora de valores faltantes

Dado un basetable que tiene una variable predictora "total_donations" con el número total de donaciones que un donante ha hecho. Esta variable puede tener valores faltantes, lo que indica que ese donante nunca ha hecho una donación antes. Esta es información importante por sí misma, así que conviene crear una variable "no_donations" que indique si "total_donations" falta.

Este ejercicio forma parte del curso

Análisis predictivo intermedio en Python

Ver curso

Instrucciones del ejercicio

  • Crea una nueva columna "no_donations" en basetable que tome el valor 1 si total_donations falta y 0 en caso contrario.
  • Calcula el número de valores faltantes en total_donations y asígnalo a number_na.
  • Imprime el porcentaje de valores faltantes.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])

# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)

# Calculate percentage of missing values
print(round(____ / ____(____), 2))
Editar y ejecutar código