Distribuzione campionaria vs. distribuzione bootstrap
La distribuzione campionaria e la distribuzione bootstrap sono strettamente collegate. Nei rari casi in cui puoi campionare ripetutamente da una popolazione, e mentre impari entrambe, è utile generare prima la distribuzione campionaria e poi la distribuzione bootstrap, una dopo l’altra, per vedere come si relazionano.
Qui, la statistica che ti interessa è la media del punteggio di popularity dei brani.
Sono disponibili spotify_population (l’intero insieme di dati) e spotify_sample (solo 500 righe che rappresentano un campione originale); dplyr è caricato.
Questo esercizio fa parte del corso
Campionamento in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
# Use 2000 replicates
___,
expr = {
# Start with the population
___ %>%
# Sample 500 rows without replacement
___ %>%
# Calculate the mean popularity as mean_popularity
___ %>%
# Pull out the mean popularity
___
}
)
# See the result
mean_popularity_2000_samp