ComenzarEmpieza gratis

Densidad de aleatorización

Usar 100 repeticiones te ayuda a entender el mecanismo de permutar. Sin embargo, 100 no es suficiente para observar todo el rango de valores probables para las diferencias nulas en proporciones.

Recuerda los cuatro pasos de la inferencia. Estos son los mismos cuatro pasos que usarás en todos los ejercicios de inferencia de este curso y en futuros cursos de inferencia estadística. Usa los nombres de las funciones para ayudarte a recordar el proceso de análisis.

  • specify especifica las variables respuesta y explicativa.
  • hypothesize declara la hipótesis nula.
  • generate genera remuestras, permutaciones o simulaciones.
  • calculate calcula estadísticas resumen.

En este ejercicio, repetirás el proceso 1000 veces para hacerte una idea de la distribución completa de las diferencias nulas en proporciones.

Este ejercicio forma parte del curso

Fundamentos de la inferencia en R

Ver curso

Instrucciones del ejercicio

Los paquetes dplyr, ggplot2, NHANES e infer ya están cargados.

  • Genera 1000 diferencias en proporciones barajando la variable HomeOwn usando la sintaxis de infer. Recuerda la sintaxis de infer:
    • specify que la relación de interés es HomeOwn frente a Gender y que un éxito en este contexto es la propiedad de vivienda, success = "Own".
    • hypothesize que la nula es cierta donde null = "independence" (es decir, género y propiedad de vivienda no están relacionados).
    • generate 1000 permutaciones; establece reps en 1000.
    • calculate la estadística stat = "diff in props" con el orden c("male", "female").
  • Ejecuta el código del gráfico de densidad para crear una representación suavizada de la distribución de diferencias. ¿Qué forma tiene la curva?

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Perform 1000 permutations
homeown_perm <- homes %>%
  # Specify HomeOwn vs. Gender, with `"Own" as success
  ___(___ ~ ___, success = "___") %>%
  # Use a null hypothesis of independence
  ___(___) %>% 
  # Generate 1000 repetitions (by permutation)
  ___(reps = ___, type = "permute") %>% 
  # Calculate the difference in proportions (male then female)
  ___(___, order = ___))

# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) + 
  geom_density()
Editar y ejecutar código