Steekproefverdeling vs. bootstrapverdeling
De steekproefverdeling en de bootstrapverdeling hangen nauw met elkaar samen. In situaties waarin je herhaald kunt steekproeven uit een populatie (dat komt zelden voor) en terwijl je over beide leert, is het nuttig om eerst de steekproefverdeling en daarna de bootstrapverdeling te genereren, zodat je kunt zien hoe ze zich tot elkaar verhouden.
Hier is de statistiek waarin je geïnteresseerd bent het gemiddelde van de popularity-score van de nummers.
spotify_population (de volledige gegevensset) en spotify_sample (alleen 500 rijen die een oorspronkelijke steekproef voorstellen) zijn beschikbaar; dplyr is geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
# Use 2000 replicates
___,
expr = {
# Start with the population
___ %>%
# Sample 500 rows without replacement
___ %>%
# Calculate the mean popularity as mean_popularity
___ %>%
# Pull out the mean popularity
___
}
)
# See the result
mean_popularity_2000_samp