ComeçarComece gratuitamente

Tratamento de dados ausentes

Neste exercício, você está trabalhando com outra versão dos dados accounts que contém valores ausentes para as colunas cust_id e acct_amount.

Você quer descobrir quantos clientes únicos o banco tem, bem como o valor médio mantido pelos clientes. Você sabe que as linhas com cust_id faltando não ajudam muito e que, em média, acct_amount costuma ser 5 vezes maior do que inv_amount.

Neste exercício, você eliminará as linhas de accounts com cust_ids ausentes e imputará os valores ausentes de inv_amount com algum conhecimento de domínio. dplyr e assertive estão carregados e accounts está disponível.

Este exercício faz parte do curso

Limpeza de dados no R

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Editar e executar código