Tratamento de dados ausentes
Neste exercício, você está trabalhando com outra versão dos dados accounts que contém valores ausentes para as colunas cust_id e acct_amount.
Você quer descobrir quantos clientes únicos o banco tem, bem como o valor médio mantido pelos clientes. Você sabe que as linhas com cust_id faltando não ajudam muito e que, em média, acct_amount costuma ser 5 vezes maior do que inv_amount.
Neste exercício, você eliminará as linhas de accounts com cust_ids ausentes e imputará os valores ausentes de inv_amount com algum conhecimento de domínio. dplyr e assertive estão carregados e accounts está disponível.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean