Tratamiento de los datos que faltan
En este ejercicio, está trabajando con otra versión de los datos de accounts
que contiene valores perdidos para las columnas cust_id
y acct_amount
.
Quiere averiguar cuántos clientes únicos tiene el banco, así como el importe medio que poseen los clientes. Ya sabe que las filas en las que falta cust_id
no le sirven de mucho y que, por término medio, acct_amount
suele ser 5 veces mayor que inv_amount
.
En este ejercicio, eliminará las filas de accounts
en las que falte cust_id
e imputará los valores que falten de inv_amount
con algún conocimiento del dominio. dplyr
y assertive
están cargados y accounts
está disponible.
Este ejercicio forma parte del curso
Limpieza de datos en R
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean