Tratamiento de los datos que faltan
En este ejercicio, está trabajando con otra versión de los datos de accounts que contiene valores perdidos para las columnas cust_id y acct_amount.
Quiere averiguar cuántos clientes únicos tiene el banco, así como el importe medio que poseen los clientes. Ya sabe que las filas en las que falta cust_id no le sirven de mucho y que, por término medio, acct_amount suele ser 5 veces mayor que inv_amount.
En este ejercicio, eliminará las filas de accounts en las que falte cust_ide imputará los valores que falten de inv_amount con algún conocimiento del dominio. dplyr y assertive están cargados y accounts está disponible.
Este ejercicio forma parte del curso
Limpieza de datos en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean