Tratamento de dados ausentes
Neste exercício, você está trabalhando com outra versão dos dados accounts
que contém valores ausentes para as colunas cust_id
e acct_amount
.
Você quer descobrir quantos clientes únicos o banco tem, bem como o valor médio mantido pelos clientes. Você sabe que as linhas com cust_id
faltando não ajudam muito e que, em média, acct_amount
costuma ser 5 vezes maior do que inv_amount
.
Neste exercício, você eliminará as linhas de accounts
com cust_id
s ausentes e imputará os valores ausentes de inv_amount
com algum conhecimento de domínio. dplyr
e assertive
estão carregados e accounts
está disponível.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean