Steekproefverdeling vs. bootstrapverdeling
De steekproefverdeling en de bootstrapverdeling hangen nauw met elkaar samen. In situaties waarin je herhaaldelijk uit een populatie kunt steekproeven (dat komt zelden voor), is het handig om eerst de steekproefverdeling en daarna de bootstrapverdeling te genereren om te zien hoe ze zich tot elkaar verhouden.
Hier is de statistiek waarin je geïnteresseerd bent het gemiddelde popularity-cijfer van de nummers.
spotify_population (de volledige gegevensset) en spotify_sample (500 willekeurig getrokken rijen uit spotify_population) zijn beschikbaar; pandas en numpy zijn geladen met hun gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
Steekproeven in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)