ComeçarComece de graça

teste t para MAR: preparação dos dados

Ótimo trabalho ao classificar os mecanismos de dados ausentes no exercício anterior! Entre os três, MAR é provavelmente o mais importante de detectar, já que muitos métodos de imputação assumem que os dados são MAR. Portanto, este exercício vai se concentrar em testar MAR.

Você vai trabalhar com o já conhecido conjunto biopics. O objetivo é testar se o número de valores ausentes em earnings varia conforme o gênero do sujeito. Neste exercício, você só vai preparar os dados para o teste t. Primeiro, você criará uma variável binária indicando ausência em earnings. Em seguida, você vai separá-la por gênero filtrando os dados para manter um dos gêneros e depois aplicando pull() na variável binária. Para filtrar, pode ser útil imprimir o head() de biopics no console e examinar a variável de gênero.

Este exercício faz parte do curso

Tratamento de Dados Ausentes com Imputações em R

Ver curso

Instruções do exercício

  • Adicione outra variável a biopics chamada missing_earnings que seja TRUE se earnings estiver ausente e FALSE caso contrário.
  • Crie um vetor de valores missing_earnings para homens e atribua a missing_earnings_males.
  • Crie um vetor de valores missing_earnings para mulheres e atribua a missing_earnings_females.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a dummy variable for missing earnings
biopics <- biopics %>% 
  ___(missing_earnings = ___(___))

# Pull the missing earnings dummy for males
missing_earnings_males <- biopics %>% 
  ___(___) %>% 
  ___(___)

# Pull the missing earnings dummy for females
missing_earnings_females <- biopics %>% 
  ___(___) %>% 
  ___(___)
Editar e executar o código