Distribuzione campionaria vs. distribuzione bootstrap
La distribuzione campionaria e la distribuzione bootstrap sono strettamente collegate. Nelle situazioni in cui puoi campionare ripetutamente da una popolazione (evento raro), è utile generare sia la distribuzione campionaria sia la distribuzione bootstrap, una dopo l'altra, per vedere come sono correlate.
Qui, la statistica che ti interessa è la media del punteggio di popularity dei brani.
Sono disponibili spotify_population (l'intero insieme di dati) e spotify_sample (500 righe campionate casualmente da spotify_population); pandas e numpy sono già importate con i soliti alias.
Questo esercizio fa parte del corso
Campionamento in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)