1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Bootstrap i błąd standardowy

Wyobraź sobie park narodowy, w którym strażnicy codziennie przemierzają szlaki podczas obchodów. Trasy nie są zawsze takie same, ale każdy strażnik zapisuje pokonaną odległość i czas. Chcemy zbudować model statystyczny opisujący dobowe wahania pokonanej odległości na podstawie ograniczonej próbki danych od jednego strażnika.

Twoim celem jest użycie resampligu bootstrapowego – polegającego na obliczeniu jednej średniej dla każdej próbki bootstrapowej – aby uzyskać rozkład średnich, a następnie wyznaczenie błędu standardowego jako miary „niepewności" statystyki próbkowej jako estymatora statystyki populacji.

Skorzystaj z wczytanej tablicy sample_data zawierającej 500 niezależnych pomiarów pokonanej odległości. Na razie używamy symulowanego zbioru danych, aby uprościć tę lekcję. Później zobaczymy bardziej realistyczne dane.

Instrukcje

100 XP
  • Przypisz sample_data jako model populacji.

  • Wykonaj pętlę num_resamples razy:

    • Za każdym razem użyj np.random.choice(), aby wygenerować bootstrap_sample o rozmiarze size=resample_size pobranej z population_model – ustaw replace=True.
    • Oblicz i zapisz średnią próbki przy każdej iteracji.
  • Oblicz i wyświetl np.mean() oraz np.std() dla bootstrap_means.

  • Skorzystaj z predefiniowanej funkcji plot_data_hist() i zwizualizuj rozkład bootstrap_means.