Densidad de aleatorización
Usar 100 repeticiones te ayuda a entender el mecanismo de permutar. Sin embargo, 100 no es suficiente para observar todo el rango de valores probables para las diferencias nulas en proporciones.
Recuerda los cuatro pasos de la inferencia. Estos son los mismos cuatro pasos que usarás en todos los ejercicios de inferencia de este curso y en futuros cursos de inferencia estadística. Usa los nombres de las funciones para ayudarte a recordar el proceso de análisis.
specifyespecifica las variables respuesta y explicativa.hypothesizedeclara la hipótesis nula.generategenera remuestras, permutaciones o simulaciones.calculatecalcula estadísticas resumen.
En este ejercicio, repetirás el proceso 1000 veces para hacerte una idea de la distribución completa de las diferencias nulas en proporciones.
Este ejercicio forma parte del curso
Fundamentos de la inferencia en R
Instrucciones del ejercicio
Los paquetes dplyr, ggplot2, NHANES e infer ya están cargados.
- Genera 1000 diferencias en proporciones barajando la variable
HomeOwnusando la sintaxis deinfer. Recuerda la sintaxis deinfer:specifyque la relación de interés esHomeOwnfrente aGendery que un éxito en este contexto es la propiedad de vivienda,success = "Own".hypothesizeque la nula es cierta dondenull = "independence"(es decir, género y propiedad de vivienda no están relacionados).generate1000 permutaciones; establecerepsen 1000.calculatela estadísticastat = "diff in props"con el ordenc("male", "female").
- Ejecuta el código del gráfico de densidad para crear una representación suavizada de la distribución de diferencias. ¿Qué forma tiene la curva?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()