Distribuzione campionaria vs. distribuzione bootstrap

La distribuzione campionaria e la distribuzione bootstrap sono strettamente collegate. Nei rari casi in cui puoi campionare ripetutamente da una popolazione, e mentre impari entrambe, è utile generare prima la distribuzione campionaria e poi la distribuzione bootstrap, una dopo l’altra, per vedere come si relazionano.

Qui, la statistica che ti interessa è la media del punteggio di popularity dei brani.

Sono disponibili spotify_population (l’intero insieme di dati) e spotify_sample (solo 500 righe che rappresentano un campione originale); dplyr è caricato.

Questo esercizio fa parte del corso

Campionamento in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp

Modifica ed esegui il codice