Stap voor stap door de permutatie

Om je te helpen de code te begrijpen die wordt gebruikt om de randomisatiedistributie te maken, loodst deze oefening je door de stappen van het infer-framework. Je ziet vooral hoe verschillen in de gegenereerde replicaten de berekende statistieken beïnvloeden.

Let er na het uitvoeren van de infer-stappen op dat de aantallen per replicaat steeds net iets anders zijn.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Bekijk cursus

Oefeninstructies

De pakketten dplyr en infer zijn voor je geladen, samen met het data frame disc uit de vorige oefening.

Roep de functies aan voor de eerste drie stappen. Het werk is al gedaan; jouw taak is om de resultaten van de eerste drie infer-stappen te onderzoeken.
Om het effect van permuteren te zien,
- groepeer het gepermuteerde data frame, disc_perm, op de nieuwe variabele replicate, en
- tel de variabelen van interesse (promote binnen elke sex) met count().
Gebruik disc_perm om met calculate() de statistiek van interesse te berekenen. Stel stat in op "diff in props" en order op c("male", "female").

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___

Code bewerken en uitvoeren