teste t para MAR: preparação dos dados
Ótimo trabalho ao classificar os mecanismos de dados ausentes no exercício anterior! Entre os três, MAR é provavelmente o mais importante de detectar, já que muitos métodos de imputação assumem que os dados são MAR. Portanto, este exercício vai se concentrar em testar MAR.
Você vai trabalhar com o já conhecido conjunto biopics. O objetivo é testar se o número de valores ausentes em earnings varia conforme o gênero do sujeito. Neste exercício, você só vai preparar os dados para o teste t. Primeiro, você criará uma variável binária indicando ausência em earnings. Em seguida, você vai separá-la por gênero filtrando os dados para manter um dos gêneros e depois aplicando pull() na variável binária. Para filtrar, pode ser útil imprimir o head() de biopics no console e examinar a variável de gênero.
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Instruções do exercício
- Adicione outra variável a
biopicschamadamissing_earningsque sejaTRUEseearningsestiver ausente eFALSEcaso contrário. - Crie um vetor de valores
missing_earningspara homens e atribua amissing_earnings_males. - Crie um vetor de valores
missing_earningspara mulheres e atribua amissing_earnings_females.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a dummy variable for missing earnings
biopics <- biopics %>%
___(missing_earnings = ___(___))
# Pull the missing earnings dummy for males
missing_earnings_males <- biopics %>%
___(___) %>%
___(___)
# Pull the missing earnings dummy for females
missing_earnings_females <- biopics %>%
___(___) %>%
___(___)