Pas à pas à travers la permutation
Pour vous aider à comprendre le code utilisé pour créer la distribution de randomisation, cet exercice vous guidera à travers les étapes du framework infer. Vous verrez en particulier comment les différences entre les répliques générées influencent les statistiques calculées.
Après avoir exécuté les étapes infer, notez bien que les nombres varient légèrement d’une réplique à l’autre.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
Les packages dplyr et infer ont été chargés pour vous, ainsi que le data frame disc de l’exercice précédent.
- Appelez les fonctions pour les trois premières étapes. Le travail a été fait pour vous, votre rôle est d’examiner les résultats de l’appel des trois premières étapes
infer. - Pour voir l’effet de la permutation,
- regroupez le data frame permuté,
disc_perm, par la nouvelle variablereplicate, puis - comptez les variables d’intérêt (
promoteau sein de chaquesex) à l’aide decount().
- regroupez le data frame permuté,
- À partir de
disc_perm, utilisezcalculate()pour obtenir la statistique d’intérêt. Définissezstatà"diff in props"etorderàc("male", "female").
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___