Les données proviennent-elles de la population ?
Rappelez-vous que la différence observée (c’est-à-dire la différence de proportions dans le jeu de données homes, représentée par la ligne verticale rouge) était d’environ -0,0078, ce qui semble se situer en dessous de l’essentiel de la densité des différences permutées. Il est toutefois important de savoir si certaines des différences permutées aléatoirement étaient aussi extrêmes que la différence observée.
Dans cet exercice, vous allez recréer ce nuage de points sous forme de courbe de densité et compter le nombre de différences permutées situées à gauche de la différence observée.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
Le jeu de données homeown_perm est disponible dans votre espace de travail.
- À l’aide de
geom_density(), tracez les différences permutées. - Ajoutez une ligne verticale rouge avec
geom_vline()à l’endroit où se situe la différence observée.diff_origest fourni dans votre espace de travail et représente la valeur initiale de la statistique de différence. - Comptez le nombre de différences permutées inférieures ou égales à la différence observée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) +
# Add a density layer
___() +
# Add a vline layer with intercept diff_orig
___(aes(xintercept = ___), color = "red")
# Compare permuted differences to observed difference
homeown_perm %>%
summarize(n_perm_le_obs = sum(___ <= ___))