Steekproefverdeling vs. bootstrapverdeling

De steekproefverdeling en de bootstrapverdeling hangen nauw met elkaar samen. In situaties waarin je herhaald kunt steekproeven uit een populatie (dat komt zelden voor) en terwijl je over beide leert, is het nuttig om eerst de steekproefverdeling en daarna de bootstrapverdeling te genereren, zodat je kunt zien hoe ze zich tot elkaar verhouden.

Hier is de statistiek waarin je geïnteresseerd bent het gemiddelde van de popularity-score van de nummers.

spotify_population (de volledige gegevensset) en spotify_sample (alleen 500 rijen die een oorspronkelijke steekproef voorstellen) zijn beschikbaar; dplyr is geladen.

Deze oefening maakt deel uit van de cursus

Steekproeven in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp

Code bewerken en uitvoeren