Steekproefverdeling vs. bootstrapverdeling

De steekproefverdeling en de bootstrapverdeling hangen nauw met elkaar samen. In situaties waarin je herhaaldelijk uit een populatie kunt steekproeven (dat komt zelden voor), is het handig om eerst de steekproefverdeling en daarna de bootstrapverdeling te genereren om te zien hoe ze zich tot elkaar verhouden.

Hier is de statistiek waarin je geïnteresseerd bent het gemiddelde popularity-cijfer van de nummers.

spotify_population (de volledige gegevensset) en spotify_sample (500 willekeurig getrokken rijen uit spotify_population) zijn beschikbaar; pandas en numpy zijn geladen met hun gebruikelijke aliassen.

Deze oefening maakt deel uit van de cursus

Steekproeven in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

mean_popularity_2000_samp = []

# Generate a sampling distribution of 2000 replicates
____:
    mean_popularity_2000_samp.append(
    	# Sample 500 rows and calculate the mean popularity 
    	____
    )

# Print the sampling distribution results
print(mean_popularity_2000_samp)

Code bewerken en uitvoeren