Distribution d’échantillonnage vs. distribution bootstrap
La distribution d’échantillonnage et la distribution bootstrap sont étroitement liées. Dans les rares situations où vous pouvez échantillonner de manière répétée à partir d’une population, et au fur et à mesure que vous apprenez ces deux notions, il est utile de générer successivement la distribution d’échantillonnage puis la distribution bootstrap pour visualiser leur relation.
Ici, la statistique qui vous intéresse est la moyenne du score de popularity des morceaux.
spotify_population (l’ensemble du jeu de données) et spotify_sample (500 lignes représentant un échantillon initial) sont disponibles ; dplyr est chargé.
Cet exercice fait partie du cours
Échantillonnage en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
# Use 2000 replicates
___,
expr = {
# Start with the population
___ %>%
# Sample 500 rows without replacement
___ %>%
# Calculate the mean popularity as mean_popularity
___ %>%
# Pull out the mean popularity
___
}
)
# See the result
mean_popularity_2000_samp