Aan de slagGa gratis aan de slag

Een bootstrapverdeling genereren

Het proces om een bootstrapverdeling te genereren lijkt op dat voor een steekproefverdeling; alleen de eerste stap is anders.

Voor een steekproefverdeling begin je met de populatie en trek je steekproeven zonder terugleggen. Voor een bootstrapverdeling begin je met een steekproef en hersteekproef je daaruit mét terugleggen. Daarna zijn de stappen hetzelfde: bereken op die (her)steekproef de samenvattende statistiek waarin je geïnteresseerd bent en herhaal dit proces vaak. In beide gevallen kun je de verdeling visualiseren met een histogram.

Hier is spotify_sample een subset van de gegevensset spotify_population. Om beter te laten zien hoe resampling werkt, is er een rij-indexkolom met de naam 'index' toegevoegd, en zijn alleen de kolommen met de artiestennaam, songtitel en danceability opgenomen.

spotify_sample is beschikbaar; pandas, numpy en matplotlib.pyplot zijn geladen met hun gebruikelijke aliassen.

Deze oefening maakt deel uit van de cursus

Steekproeven in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate 1 bootstrap resample
spotify_1_resample = ____

# Print the resample
print(spotify_1_resample)
Code bewerken en uitvoeren