Inversores omitidos
Tratar los datos que faltan es una de las tareas más comunes en la ciencia de datos. Existen diversos tipos de omisiones, así como diversos tipos de soluciones a los datos omitidos.
Acabas de recibir una nueva versión del DataFrame banking
que contiene datos sobre el importe mantenido e invertido por clientes nuevos y existentes. Sin embargo, hay filas en las que faltan valores de inv_amount
.
Sabes a ciencia cierta que la mayoría de los clientes menores de 25 años aún no tienen cuentas de inversión, y sospechas que podría ser el motivo de la falta de datos. Los paquetes pandas
, missingno
y matplotlib.pyplot
se han importado como pd
, msno
y plt
respectivamente. El DataFrame banking
está en tu entorno.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print number of missing values in banking
print(____)
# Visualize missingness matrix
____
____