Moyennes de la population et des distributions d’échantillonnage
L’un des atouts des distributions d’échantillonnage est qu’on peut les quantifier. En particulier, on peut en calculer des statistiques de synthèse. Ici, nous allons examiner la relation entre la moyenne de la distribution d’échantillonnage et le paramètre de population que l’échantillonnage est censé estimer.
Trois distributions d’échantillonnage sont fournies. Dans chaque cas, le jeu de données sur l’attrition des employés a été échantillonné par tirage aléatoire simple, puis la moyenne de l’attrition a été calculée. Cette opération a été répétée 1000 fois pour obtenir une distribution d’échantillonnage des moyennes d’attrition. Une distribution d’échantillonnage utilise une taille d’échantillon de 5 pour chaque réplicat, une autre 50, et une autre 500.
attrition_pop, sampling_distribution_5, sampling_distribution_50, et sampling_distribution_500 sont disponibles ; dplyr est chargé.
Cet exercice fait partie du cours
Échantillonnage en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean across replicates of the mean attritions in sampling_distribution_5
mean_of_means_5 <- sampling_distribution_5 %>%
___
# Do the same for sampling_distribution_50
mean_of_means_50 <- ___
# ... and for sampling_distribution_500
mean_of_means_500 <- ___
# See the results
mean_of_means_5
mean_of_means_50
mean_of_means_500