Paso a paso por la permutación

Para ayudarte a entender el código usado para crear la distribución de aleatorización, este ejercicio te guiará por los pasos del framework infer. En particular, verás cómo las diferencias en las réplicas generadas afectan a las estadísticas calculadas.

Después de ejecutar los pasos de infer, fíjate en que los números cambian ligeramente en cada réplica.

Este ejercicio forma parte del curso

Fundamentos de la inferencia en R

Ver curso

Instrucciones del ejercicio

Los paquetes dplyr e infer ya se han cargado por ti, junto con el data frame disc del ejercicio anterior.

Llama a las funciones para los tres primeros pasos. El trabajo ya está hecho; tu tarea es investigar los resultados de llamar a los tres primeros pasos de infer.
Para ver el efecto de permutar,
- agrupa el data frame permutado, disc_perm, por la nueva variable replicate, y luego
- cuenta las variables de interés (promote dentro de cada sex) usando count().
Usando disc_perm, calculate() la estadística de interés. Establece stat a "diff in props" y order a c("male", "female").

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___

Editar y ejecutar código