CommencerCommencer gratuitement

Les données proviennent-elles de la population ?

Rappelez-vous que la différence observée (c’est-à-dire la différence de proportions dans le jeu de données homes, représentée par la ligne verticale rouge) était d’environ -0,0078, ce qui semble se situer en dessous de l’essentiel de la densité des différences permutées. Il est toutefois important de savoir si certaines des différences permutées aléatoirement étaient aussi extrêmes que la différence observée.

Dans cet exercice, vous allez recréer ce nuage de points sous forme de courbe de densité et compter le nombre de différences permutées situées à gauche de la différence observée.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

Le jeu de données homeown_perm est disponible dans votre espace de travail.

  • À l’aide de geom_density(), tracez les différences permutées.
  • Ajoutez une ligne verticale rouge avec geom_vline() à l’endroit où se situe la différence observée. diff_orig est fourni dans votre espace de travail et représente la valeur initiale de la statistique de différence.
  • Comptez le nombre de différences permutées inférieures ou égales à la différence observée.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) + 
  # Add a density layer
  ___() +
  # Add a vline layer with intercept diff_orig
  ___(aes(xintercept = ___), color = "red")

# Compare permuted differences to observed difference
homeown_perm %>%
  summarize(n_perm_le_obs = sum(___ <= ___))
Modifier et exécuter le code