1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Replikaty bootstrapowe średniej i błąd standardowy SEM

W tym ćwiczeniu obliczysz bootstrapowe oszacowanie funkcji gęstości prawdopodobieństwa średniej rocznej sumy opadów na stacji meteorologicznej w Sheffield. Estymujemy tutaj średnią roczną sumę opadów, jaką uzyskalibyśmy, gdyby stacja mogła nieskończenie powtarzać wszystkie pomiary z lat 1883–2015. Jest to probabilistyczne oszacowanie średniej. Wynik przedstawisz na histogramie jako wykres PDF – zobaczysz, że ma kształt rozkładu normalnego.

Można bowiem wykazać teoretycznie, że przy niezbyt restrykcyjnych założeniach wartość średniej zawsze ma rozkład normalny. (Nie jest to twierdzenie ogólne – dotyczy średniej i kilku innych statystyk.) Odchylenie standardowe tego rozkładu nosi nazwę błędu standardowego średniej (SEM) i jest równe odchyleniu standardowemu danych podzielonemu przez pierwiastek kwadratowy z liczby punktów, tj. sem = np.std(data) / np.sqrt(len(data)). Stosując podejście haker-statystyczne, uzyskasz ten sam wynik bez konieczności wyprowadzania wzoru – a następnie zweryfikujesz go na podstawie swoich replikatów bootstrapowych.

Zbiór danych został wstępnie wczytany do tablicy o nazwie rainfall.

Instrukcje

100 XP
  • Wygeneruj 10000 bootstrapowych replikatów średniej rocznej sumy opadów, korzystając z funkcji draw_bs_reps() i tablicy rainfall. Wskazówka: Przekaż np.mean jako argument func, aby obliczyć średnią.
    • Przypomnienie: draw_bs_reps() przyjmuje 3 argumenty: data, func i size.
  • Oblicz i wyświetl błąd standardowy średniej dla rainfall.
    • Skorzystaj ze wzoru: np.std(data) / np.sqrt(len(data)).
  • Oblicz i wyświetl odchylenie standardowe replikatów bs_replicates.
  • Narysuj histogram replikatów, używając argumentu normed=True oraz 50 przedziałów.
  • Kliknij Prześlij odpowiedź, aby zobaczyć wykres!