1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gândire statistică în Python (Partea 2)

Connected

exercițiu

Replici bootstrap ale mediei și SEM

În acest exercițiu, vei calcula o estimare bootstrap a funcției de densitate de probabilitate a precipitațiilor anuale medii la Stația Meteorologică Sheffield. Reamintește-ți că estimăm media precipitațiilor anuale pe care am obține-o dacă Stația Meteorologică Sheffield ar putea repeta toate măsurătorile din perioada 1883–2015 de un număr infinit de ori. Aceasta este o estimare probabilistică a mediei. Vei reprezenta PDF-ul sub formă de histogramă și vei observa că are o distribuție Normală.

De altfel, se poate demonstra teoretic că, în condiții nu prea restrictive, valoarea mediei va fi întotdeauna distribuită Normal. (Acest lucru nu este valabil în general, ci doar pentru medie și câteva alte statistici.) Deviația standard a acestei distribuții, numită eroarea standard a mediei (SEM), este egală cu deviația standard a datelor împărțită la rădăcina pătrată a numărului de puncte. Adică, pentru un set de date: sem = np.std(data) / np.sqrt(len(data)). Folosind statistici de tip hacker, obții același rezultat fără să fie nevoie să-l deduci, dar îl vei verifica pe baza replicilor tale bootstrap.

Setul de date a fost preîncărcat pentru tine într-un array numit rainfall.

Instrucțiuni

100 XP
  • Extrage 10000 replici bootstrap ale mediei anuale a precipitațiilor, folosind funcția draw_bs_reps() și array-ul rainfall. Indiciu: Transmite np.mean pentru func ca să calculezi media.
    • Ca reminder, draw_bs_reps() acceptă 3 argumente: data, func și size.
  • Calculează și afișează eroarea standard a mediei pentru rainfall.
    • Formula de calcul este np.std(data) / np.sqrt(len(data)).
  • Calculează și afișează deviația standard a replicilor bootstrap bs_replicates.
  • Creează o histogramă a replicilor folosind argumentul normed=True și 50 de intervale.
  • Apasă Trimite răspunsul pentru a vedea graficul!