CommencerCommencer gratuitement

Pas à pas à travers la permutation

Pour vous aider à comprendre le code utilisé pour créer la distribution de randomisation, cet exercice vous guidera à travers les étapes du framework infer. Vous verrez en particulier comment les différences entre les répliques générées influencent les statistiques calculées.

Après avoir exécuté les étapes infer, notez bien que les nombres varient légèrement d’une réplique à l’autre.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

Les packages dplyr et infer ont été chargés pour vous, ainsi que le data frame disc de l’exercice précédent.

  • Appelez les fonctions pour les trois premières étapes. Le travail a été fait pour vous, votre rôle est d’examiner les résultats de l’appel des trois premières étapes infer.
  • Pour voir l’effet de la permutation,
    • regroupez le data frame permuté, disc_perm, par la nouvelle variable replicate, puis
    • comptez les variables d’intérêt (promote au sein de chaque sex) à l’aide de count().
  • À partir de disc_perm, utilisez calculate() pour obtenir la statistique d’intérêt. Définissez stat à "diff in props" et order à c("male", "female").

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___
Modifier et exécuter le code