Estadísticos aleatorizados y diagrama de puntos
Al permutar la variable de propiedad de vivienda varias veces, generas diferencias en proporciones que son coherentes con la suposición de que las variables no están relacionadas. La estadística de interés es la diferencia de proporciones indicada por stat = "diff in props". Tras calcular los estadísticos aleatorizados, los representarás en un diagrama de puntos.
Este ejercicio muestra los cuatro pasos del paquete infer:
specifyespecifica las variables de respuesta y explicativa.hypothesizedeclara la hipótesis nula.generategenera remuestras, permutaciones o simulaciones.calculatecalcula estadísticas resumidas.
Irás viendo cada paso a lo largo del curso; en este ejercicio escribirás el código para calculate().
Los paquetes dplyr, ggplot2, NHANES e infer ya están cargados. Repite la permutación y la visualización con 100 diferencias en proporciones generadas barajando la variable HomeOwn.
Este ejercicio forma parte del curso
Fundamentos de la inferencia en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform 100 permutations
homeown_perm <- homes %>%
specify(HomeOwn ~ Gender, success = "Own") %>%
hypothesize(null = "independence") %>%
generate(reps = 100, type = "permute") %>%
___(___, order = ___)
# Print results to console
homeown_perm