IniziaInizia gratis

Visualizzare i campioni bootstrap

In questo esercizio genererai campioni bootstrap dall’insieme di dati sulla piovosità annuale misurata alla Sheffield Weather Station nel Regno Unito dal 1883 al 2015. I dati sono memorizzati nell’array NumPy rainfall in millimetri (mm). Visualizzando graficamente i campioni bootstrap con una ECDF, puoi capire come il bootstrap permetta descrizioni probabilistiche dei dati.

Questo esercizio fa parte del corso

Pensiero statistico in Python (Parte 2)

Visualizza il corso

Istruzioni dell'esercizio

  • Scrivi un ciclo for per ottenere 50 campioni bootstrap dei dati di piovosità e traccia la loro ECDF.
    • Usa np.random.choice() per generare un campione bootstrap dall’array NumPy rainfall. Assicurati che la size dell’array ricampionato sia len(rainfall).
    • Usa la funzione ecdf() che hai scritto nel prequel di questo corso per generare i valori x e y dell’ECDF del campione bootstrap bs_sample.
    • Traccia i valori dell’ECDF. Oltre agli argomenti marker='.' e linestyle='none', specifica anche color='gray' (per punti grigi) e alpha=0.1 (per renderli semitrasparenti, dato che ne sovrapponiamo molti).
  • Usa ecdf() per generare i valori x e y dell’ECDF dei dati originali di piovosità disponibili nell’array rainfall.
  • Traccia i valori dell’ECDF dei dati originali.
  • Premi Invia per visualizzare i campioni!

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

for _ in range(50):
    # Generate bootstrap sample: bs_sample
    bs_sample = ____(____, size=____)

    # Compute and plot ECDF from bootstrap sample
    x, y = ____
    _ = plt.plot(____, ____, ____='.', ____='none',
                 ____='gray', ____=0.1)

# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')

# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')

# Show the plot
plt.show()
Modifica ed esegui il codice