Stap voor stap door de permutatie
Om je te helpen de code te begrijpen die wordt gebruikt om de randomisatiedistributie te maken, loodst deze oefening je door de stappen van het infer-framework. Je ziet vooral hoe verschillen in de gegenereerde replicaten de berekende statistieken beïnvloeden.
Let er na het uitvoeren van de infer-stappen op dat de aantallen per replicaat steeds net iets anders zijn.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
De pakketten dplyr en infer zijn voor je geladen, samen met het data frame disc uit de vorige oefening.
- Roep de functies aan voor de eerste drie stappen. Het werk is al gedaan; jouw taak is om de resultaten van de eerste drie
infer-stappen te onderzoeken. - Om het effect van permuteren te zien,
- groepeer het gepermuteerde data frame,
disc_perm, op de nieuwe variabelereplicate, en - tel de variabelen van interesse (
promotebinnen elkesex) metcount().
- groepeer het gepermuteerde data frame,
- Gebruik
disc_permom metcalculate()de statistiek van interesse te berekenen. Stelstatin op"diff in props"enorderopc("male", "female").
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___