CommencerCommencer gratuitement

Distribution d’échantillonnage ou distribution Bootstrap

La distribution d’échantillonnage et la distribution Bootstrap sont étroitement liées. Dans les cas où vous pouvez échantillonner de façon répétée une population (ces occasions sont rares), il est utile de générer à la fois la distribution d’échantillonnage et la distribution Bootstrap, l’une après l’autre, pour voir comment elles sont liées.

Ici, la statistique qui vous intéresse est le score moyen de popularity des chansons.

spotify_population (l’ensemble des données) et spotify_sample (500 lignes échantillonnées aléatoirement à partir de spotify_population) sont disponibles. pandas et numpy sont chargés avec leurs alias habituels.

Cet exercice fait partie du cours

L’échantillonnage en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

mean_popularity_2000_samp = []

# Generate a sampling distribution of 2000 replicates
____:
    mean_popularity_2000_samp.append(
    	# Sample 500 rows and calculate the mean popularity 
    	____
    )

# Print the sampling distribution results
print(mean_popularity_2000_samp)
Modifier et exécuter le code