Superposer des droites

En reprenant l’exercice précédent, vous allez maintenant répéter l’échantillonnage 100 fois afin de visualiser la distribution d’échantillonnage des droites de régression générées par 100 échantillons aléatoires différents de la population.

Plutôt que d’appeler sample_n() à répétition, comme dans l’exercice précédent, rep_sample_n() du package oilabs offre un moyen pratique de générer de nombreux échantillons aléatoires. La fonction rep_sample_n() répète la commande sample_n() reps fois.

La fonction do() de dplyr vous permet d’exécuter l’appel à lm séparément pour chaque niveau d’une variable qui a été passée à group_by. Ici, la variable de regroupement est la réplique d’échantillonnage, donc chaque lm est exécuté sur un échantillon aléatoire différent des données.

Cet exercice fait partie du cours

<cours>Inférence pour la régression linéaire en R</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Set the seed for reproducibility
set.seed(4747)

# Repeatedly sample the population without replacement
many_samples <- popdata %>%
  ___

# See the result
glimpse(many_samples)

Modifier et exécuter le code