ComenzarEmpieza gratis

t-test para MAR: preparación de datos

¡Buen trabajo clasificando los mecanismos de datos faltantes en el ejercicio anterior! De los tres, MAR es probablemente el más importante de detectar, ya que muchos métodos de imputación asumen que los datos son MAR. Por ello, este ejercicio se centrará en comprobar si se cumple MAR.

Trabajarás con el conocido conjunto biopics. El objetivo es probar si el número de valores faltantes en earnings difiere según el género del sujeto. En este ejercicio, solo prepararás los datos para la t de Student. Primero, crearás una variable indicadora (dummy) que marque valores faltantes en earnings. Después, la dividirás por género filtrando primero los datos para quedarte con uno de los géneros y luego extrayendo la variable indicadora con pull(). Para filtrar, puede ser útil imprimir el head() de biopics en la consola y examinar la variable de género.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Instrucciones del ejercicio

  • Añade otra variable a biopics llamada missing_earnings que sea TRUE si earnings falta y FALSE en caso contrario.
  • Crea un vector de valores de missing_earnings para hombres y asígnalo a missing_earnings_males.
  • Crea un vector de valores de missing_earnings para mujeres y asígnalo a missing_earnings_females.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a dummy variable for missing earnings
biopics <- biopics %>% 
  ___(missing_earnings = ___(___))

# Pull the missing earnings dummy for males
missing_earnings_males <- biopics %>% 
  ___(___) %>% 
  ___(___)

# Pull the missing earnings dummy for females
missing_earnings_females <- biopics %>% 
  ___(___) %>% 
  ___(___)
Editar y ejecutar código