ComenzarEmpieza gratis

Tratamiento de los datos que faltan

En este ejercicio, está trabajando con otra versión de los datos de accounts que contiene valores perdidos para las columnas cust_id y acct_amount.

Quiere averiguar cuántos clientes únicos tiene el banco, así como el importe medio que poseen los clientes. Ya sabe que las filas en las que falta cust_id no le sirven de mucho y que, por término medio, acct_amount suele ser 5 veces mayor que inv_amount.

En este ejercicio, eliminará las filas de accounts en las que falte cust_ide imputará los valores que falten de inv_amount con algún conocimiento del dominio. dplyr y assertive están cargados y accounts está disponible.

Este ejercicio forma parte del curso

Limpieza de datos en R

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Editar y ejecutar código