1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Wizualizacja próbek bootstrapowych

W tym ćwiczeniu wygenerujesz próbki bootstrapowe na podstawie danych o rocznych opadach deszczu mierzonych na stacji meteorologicznej w Sheffield w Wielkiej Brytanii w latach 1883–2015. Dane są zapisane w tablicy NumPy rainfall w milimetrach (mm). Graficzne przedstawienie próbek bootstrapowych za pomocą ECDF pozwoli ci zobaczyć, w jaki sposób bootstrapping umożliwia probabilistyczny opis danych.

Instrukcje

100 XP
  • Napisz pętlę for, która wygeneruje 50 próbek bootstrapowych z danych o opadach i wyrysuje ich ECDF.
    • Użyj np.random.choice(), aby wygenerować próbkę bootstrapową z tablicy NumPy rainfall. Upewnij się, że parametr size próbkowanej tablicy wynosi len(rainfall).
    • Użyj funkcji ecdf(), którą napisałeś(-aś) w poprzedniej części kursu, aby uzyskać wartości x i y dla ECDF próbki bootstrapowej bs_sample.
    • Wyrysuj wartości ECDF. Podaj color='gray' (szare punkty) i alpha=0.1 (półprzezroczystość, ponieważ nakładamy na siebie wiele próbek), a także argumenty marker='.' i linestyle='none'.
  • Użyj funkcji ecdf(), aby uzyskać wartości x i y dla ECDF oryginalnych danych o opadach z tablicy rainfall.
  • Wyrysuj wartości ECDF oryginalnych danych.
  • Kliknij „Prześlij odpowiedź", aby zobaczyć próbki na wykresie!