Visualizzare i campioni bootstrap
In questo esercizio genererai campioni bootstrap dall’insieme di dati sulla piovosità annuale misurata alla Sheffield Weather Station nel Regno Unito dal 1883 al 2015. I dati sono memorizzati nell’array NumPy rainfall in millimetri (mm). Visualizzando graficamente i campioni bootstrap con una ECDF, puoi capire come il bootstrap permetta descrizioni probabilistiche dei dati.
Questo esercizio fa parte del corso
Pensiero statistico in Python (Parte 2)
Istruzioni dell'esercizio
- Scrivi un ciclo
forper ottenere50campioni bootstrap dei dati di piovosità e traccia la loro ECDF.- Usa
np.random.choice()per generare un campione bootstrap dall’array NumPyrainfall. Assicurati che lasizedell’array ricampionato sialen(rainfall). - Usa la funzione
ecdf()che hai scritto nel prequel di questo corso per generare i valorixeydell’ECDF del campione bootstrapbs_sample. - Traccia i valori dell’ECDF. Oltre agli argomenti
marker='.'elinestyle='none', specifica anchecolor='gray'(per punti grigi) ealpha=0.1(per renderli semitrasparenti, dato che ne sovrapponiamo molti).
- Usa
- Usa
ecdf()per generare i valorixeydell’ECDF dei dati originali di piovosità disponibili nell’arrayrainfall. - Traccia i valori dell’ECDF dei dati originali.
- Premi Invia per visualizzare i campioni!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
for _ in range(50):
# Generate bootstrap sample: bs_sample
bs_sample = ____(____, size=____)
# Compute and plot ECDF from bootstrap sample
x, y = ____
_ = plt.plot(____, ____, ____='.', ____='none',
____='gray', ____=0.1)
# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')
# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')
# Show the plot
plt.show()