CommencerCommencer gratuitement

Le sondage systématique convient-il ?

Le sondage systématique pose un problème : si les données ont été triées, ou s’il existe une forme de motif ou de logique derrière l’ordre des lignes, l’échantillon obtenu peut ne pas être représentatif de l’ensemble de la population. On peut résoudre ce problème en mélangeant les lignes, mais le sondage systématique devient alors équivalent à un sondage aléatoire simple.

Ici, vous allez voir comment déterminer s’il y a un problème ou non.

attrition_sys_samp est disponible et une colonne d’identifiant de ligne a été ajoutée ; dplyr et ggplot2 sont chargés.

Cet exercice fait partie du cours

Échantillonnage en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>% 
  rowid_to_column()

# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
  # Make it a scatter plot
  ___ +
  # Add a smooth trend line
  ___
Modifier et exécuter le code