Le sondage systématique convient-il ?
Le sondage systématique pose un problème : si les données ont été triées, ou s’il existe une forme de motif ou de logique derrière l’ordre des lignes, l’échantillon obtenu peut ne pas être représentatif de l’ensemble de la population. On peut résoudre ce problème en mélangeant les lignes, mais le sondage systématique devient alors équivalent à un sondage aléatoire simple.
Ici, vous allez voir comment déterminer s’il y a un problème ou non.
attrition_sys_samp est disponible et une colonne d’identifiant de ligne a été ajoutée ; dplyr et ggplot2 sont chargés.
Cet exercice fait partie du cours
Échantillonnage en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___