Inversores omitidos
Tratar los datos que faltan es una de las tareas más comunes en la ciencia de datos. Existen diversos tipos de omisiones, así como diversos tipos de soluciones a los datos omitidos.
Acabas de recibir una nueva versión del DataFrame banking
que contiene datos sobre el importe mantenido e invertido por clientes nuevos y existentes. Sin embargo, hay filas en las que faltan valores de inv_amount
.
Sabes a ciencia cierta que la mayoría de los clientes menores de 25 años aún no tienen cuentas de inversión, y sospechas que podría ser el motivo de la falta de datos. Los paquetes pandas
, missingno
y matplotlib.pyplot
se han importado como pd
, msno
y plt
respectivamente. El DataFrame banking
está en tu entorno.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Print number of missing values in banking
print(____)
# Visualize missingness matrix
____
____