1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Funkcja do bootstrapu par

Jak omówiono w filmie, bootstrap par polega na ponownym próbkowaniu par danych. Do każdego zestawu par dopasowywana jest prosta – w tym przypadku za pomocą np.polyfit(). Powtarzamy ten proces wielokrotnie, uzyskując repliki bootstrapowe wartości parametrów. Aby mieć przydatne narzędzie do bootstrapu par, napiszesz funkcję wykonującą bootstrap par na zestawie danych x,y.

Instrukcje

100 XP
  • Zdefiniuj funkcję o sygnaturze draw_bs_pairs_linreg(x, y, size=1), która oblicza estymaty bootstrapowe parametrów regresji liniowej metodą par.
    • Użyj np.arange(), aby utworzyć tablicę indeksów od 0 do len(x). To właśnie te indeksy będziesz ponownie próbkować i używać do wybierania wartości z tablic x i y.
    • Użyj np.empty(), aby zainicjalizować tablice replik nachylenia i punktu przecięcia o rozmiarze size.
    • Napisz pętlę for, która:
      • Ponownie próbkuje indeksy inds. Użyj do tego np.random.choice().
      • Tworzy nowe tablice \(x\) i \(y\) – bs_x i bs_y – na podstawie ponownie spróbkowanych indeksów bs_inds. Wytnij odpowiednie fragmenty z x i y, używając bs_inds.
      • Używa np.polyfit() na nowych tablicach \(x\) i \(y\) oraz zapisuje obliczone nachylenie i punkt przecięcia.
    • Zwróć repliki bootstrapowe nachylenia i punktu przecięcia metodą par.