Aan de slagGa gratis aan de slag

Steekproefverdeling vs. bootstrapverdeling

De steekproefverdeling en de bootstrapverdeling hangen nauw met elkaar samen. In situaties waarin je herhaald kunt steekproeven uit een populatie (dat komt zelden voor) en terwijl je over beide leert, is het nuttig om eerst de steekproefverdeling en daarna de bootstrapverdeling te genereren, zodat je kunt zien hoe ze zich tot elkaar verhouden.

Hier is de statistiek waarin je geïnteresseerd bent het gemiddelde van de popularity-score van de nummers.

spotify_population (de volledige gegevensset) en spotify_sample (alleen 500 rijen die een oorspronkelijke steekproef voorstellen) zijn beschikbaar; dplyr is geladen.

Deze oefening maakt deel uit van de cursus

Steekproeven in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp
Code bewerken en uitvoeren