Distribution d’échantillonnage ou distribution Bootstrap
La distribution d’échantillonnage et la distribution Bootstrap sont étroitement liées. Dans les cas où vous pouvez échantillonner de façon répétée une population (ces occasions sont rares), il est utile de générer à la fois la distribution d’échantillonnage et la distribution Bootstrap, l’une après l’autre, pour voir comment elles sont liées.
Ici, la statistique qui vous intéresse est le score moyen de popularity
des chansons.
spotify_population
(l’ensemble des données) et spotify_sample
(500
lignes échantillonnées aléatoirement à partir de spotify_population
) sont disponibles. pandas
et numpy
sont chargés avec leurs alias habituels.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)