Distribuzione campionaria vs. distribuzione bootstrap

La distribuzione campionaria e la distribuzione bootstrap sono strettamente collegate. Nelle situazioni in cui puoi campionare ripetutamente da una popolazione (evento raro), è utile generare sia la distribuzione campionaria sia la distribuzione bootstrap, una dopo l'altra, per vedere come sono correlate.

Qui, la statistica che ti interessa è la media del punteggio di popularity dei brani.

Sono disponibili spotify_population (l'intero insieme di dati) e spotify_sample (500 righe campionate casualmente da spotify_population); pandas e numpy sono già importate con i soliti alias.

Questo esercizio fa parte del corso

Campionamento in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

mean_popularity_2000_samp = []

# Generate a sampling distribution of 2000 replicates
____:
    mean_popularity_2000_samp.append(
    	# Sample 500 rows and calculate the mean popularity 
    	____
    )

# Print the sampling distribution results
print(mean_popularity_2000_samp)

Modifica ed esegui il codice