1. Nauka
  2. /
  3. Kursy
  4. /
  5. Symulacje statystyczne w Pythonie

Connected

ćwiczenie

Niestandardowe estymatory

W poprzednim ćwiczeniu wykonałeś prostą metodę bootstrap, którą teraz zmodyfikujemy na potrzeby bardziej złożonych estymatorów.

Wyobraź sobie, że badasz stan zdrowia studentów. Dysponujesz danymi o wzroście i wadze 1000 osób i chcesz wyznaczyć medianę wzrostu oraz korelację między wzrostem a wagą – wraz z 95-procentowym przedziałem ufności dla obu tych wielkości. Skorzystamy z metody bootstrap.

Przeanalizuj ramkę danych pandas o nazwie df, zawierającą wzrost i wagę 1000 studentów. Na tej podstawie oblicz 95-procentowy przedział ufności zarówno dla mediany wzrostu, jak i dla korelacji między wzrostem a wagą.

Instrukcje

100 XP
  • Użyj metody .sample() na df, aby wygenerować próbkę danych z powtórzeniami, i przypisz ją do tmp_df.
  • Dla każdego wygenerowanego zbioru danych w tmp_df oblicz medianę wzrostu oraz korelację między wzrostem a wagą, korzystając z .median() i .corr().
  • Dołącz mediany wzrostu do height_medians, a wartości korelacji do hw_corr.
  • Na koniec oblicz 95-procentowe ([2.5, 97.5]) przedziały ufności dla każdej z powyższych wielkości, używając np.percentile().