Replikaty bootstrapowe średniej i błąd standardowy SEM

W tym ćwiczeniu obliczysz bootstrapowe oszacowanie funkcji gęstości prawdopodobieństwa średniej rocznej sumy opadów na stacji meteorologicznej w Sheffield. Estymujemy tutaj średnią roczną sumę opadów, jaką uzyskalibyśmy, gdyby stacja mogła nieskończenie powtarzać wszystkie pomiary z lat 1883–2015. Jest to probabilistyczne oszacowanie średniej. Wynik przedstawisz na histogramie jako wykres PDF – zobaczysz, że ma kształt rozkładu normalnego.

Można bowiem wykazać teoretycznie, że przy niezbyt restrykcyjnych założeniach wartość średniej zawsze ma rozkład normalny. (Nie jest to twierdzenie ogólne – dotyczy średniej i kilku innych statystyk.) Odchylenie standardowe tego rozkładu nosi nazwę błędu standardowego średniej (SEM) i jest równe odchyleniu standardowemu danych podzielonemu przez pierwiastek kwadratowy z liczby punktów, tj. sem = np.std(data) / np.sqrt(len(data)). Stosując podejście haker-statystyczne, uzyskasz ten sam wynik bez konieczności wyprowadzania wzoru – a następnie zweryfikujesz go na podstawie swoich replikatów bootstrapowych.

Zbiór danych został wstępnie wczytany do tablicy o nazwie rainfall.

Wygeneruj 10000 bootstrapowych replikatów średniej rocznej sumy opadów, korzystając z funkcji draw_bs_reps() i tablicy rainfall. Wskazówka: Przekaż np.mean jako argument func, aby obliczyć średnią.
- Przypomnienie: draw_bs_reps() przyjmuje 3 argumenty: data, func i size.
Oblicz i wyświetl błąd standardowy średniej dla rainfall.
- Skorzystaj ze wzoru: np.std(data) / np.sqrt(len(data)).
Oblicz i wyświetl odchylenie standardowe replikatów bs_replicates.
Narysuj histogram replikatów, używając argumentu normed=True oraz 50 przedziałów.
Kliknij Prześlij odpowiedź, aby zobaczyć wykres!

ćwiczenie

Replikaty bootstrapowe średniej i błąd standardowy SEM

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie