Generare una distribuzione bootstrap
Il processo per generare una distribuzione bootstrap è simile a quello per generare una distribuzione campionaria; cambia solo il primo passaggio.
Per creare una distribuzione campionaria, parti dalla popolazione e campioni senza reinserimento. Per creare una distribuzione bootstrap, parti da un campione e ricampioni con reinserimento. Dopo di che, i passaggi sono gli stessi: calcola la statistica riassuntiva che ti interessa su quel campione/ricampione, poi ripeti il processo molte volte. In entrambi i casi, puoi visualizzare la distribuzione con un istogramma.
Qui, spotify_sample è un sottoinsieme dell'insieme di dati spotify_population. Per rendere più chiaro come funziona il ricampionamento, è stata aggiunta una colonna indice di riga chiamata 'index' e sono state incluse solo le colonne con il nome dell'artista, il titolo del brano e danceability.
spotify_sample è disponibile; pandas, numpy e matplotlib.pyplot sono caricati con i consueti alias.
Questo esercizio fa parte del corso
Campionamento in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)