1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Korelacja danych potomstwa i rodziców

Aby ilościowo opisać korelację między głębokością dzioba potomstwa a rodziców, chcemy obliczyć odpowiednie statystyki – na przykład współczynnik korelacji Pearsona – między pokoleniami. Żeby uzyskać przedziały ufności, musimy zastosować bootstrap par.

Napisałeś(-aś) już wcześniej funkcję wykonującą bootstrap par w celu estymacji parametrów regresji liniowej. Twoim zadaniem w tym ćwiczeniu jest napisanie nowej funkcji o sygnaturze draw_bs_pairs(x, y, func, size=1), która przeprowadza bootstrap par i oblicza pojedynczą statystykę na próbkach par. Interesująca nas statystyka jest obliczana przez wywołanie func(bs_x, bs_y). W następnym ćwiczeniu użyjesz pearson_r jako func.

Instrukcje

100 XP
  • Utwórz tablicę indeksów do próbkowania. (Pamiętaj, że w bootstrapie par losowo wybieramy indeksy i na ich podstawie tworzymy pary.)
  • Zainicjuj tablicę replik bootstrapowych. Powinna to być jednowymiarowa tablica o długości size.
  • Napisz pętlę for, która pobiera próbki:
  • Losowo wybierz indeksy z tablicy indeksów, którą wcześniej utworzyłeś(-aś).
  • Wyodrębnij wartości x i y z tablicy wejściowej, używając wybranych indeksów, aby wygenerować próbkę bootstrapową.
  • Użyj func, aby obliczyć interesującą nas statystykę na bootstrapowych próbkach x i y, i zapisz wynik w tablicy replik bootstrapowych.
  • Zwróć tablicę replik bootstrapowych.