Paso a paso por la permutación
Para ayudarte a entender el código usado para crear la distribución de aleatorización, este ejercicio te guiará por los pasos del framework infer. En particular, verás cómo las diferencias en las réplicas generadas afectan a las estadísticas calculadas.
Después de ejecutar los pasos de infer, fíjate en que los números cambian ligeramente en cada réplica.
Este ejercicio forma parte del curso
Fundamentos de la inferencia en R
Instrucciones del ejercicio
Los paquetes dplyr e infer ya se han cargado por ti, junto con el data frame disc del ejercicio anterior.
- Llama a las funciones para los tres primeros pasos. El trabajo ya está hecho; tu tarea es investigar los resultados de llamar a los tres primeros pasos de
infer. - Para ver el efecto de permutar,
- agrupa el data frame permutado,
disc_perm, por la nueva variablereplicate, y luego - cuenta las variables de interés (
promotedentro de cadasex) usandocount().
- agrupa el data frame permutado,
- Usando
disc_perm,calculate()la estadística de interés. Establecestata"diff in props"yorderac("male", "female").
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___