Een bootstrapverdeling genereren
Het proces om een bootstrapverdeling te genereren lijkt opvallend veel op het proces voor een steekproefverdeling; alleen de eerste stap is anders.
Voor een steekproefverdeling begin je bij de populatie en trek je steekproeven zonder teruglegging. Voor een bootstrapverdeling begin je bij een steekproef en hersteekproef je met teruglegging. Daarna zijn de stappen hetzelfde: bereken de samenvattende statistiek waarin je geïnteresseerd bent op die (her)steekproef en herhaal dit proces vaak. In beide gevallen kun je de verdeling visualiseren met een histogram.
Hier is spotify_sample een subset van de gegevensset spotify_population. Om beter te laten zien hoe hersteekproeven werken, is er een rijnummerkolom toegevoegd en zijn alleen de artiestnaam, de songnaam en de kolom danceability opgenomen.
spotify_sample is beschikbaar; dplyr en ggplot2 zijn geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample