1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Szacowanie prędkości i przedziału ufności

Kontynuujmy analizę danych turystycznych z parków narodowych. Zwróć uwagę, że niektóre wartości dystansu są ujemne – oznacza to ruch w kierunku przeciwnym do punktu startowego szlaku. Dane są niedoskonałe, więc skupmy się na ogólnym trendzie.

Celem tego ćwiczenia jest zastosowanie metody bootstrap do wyznaczenia rozkładu wartości prędkości dla modelu liniowego, a następnie obliczenie na jego podstawie najlepszego oszacowania prędkości oraz 90-procentowego przedziału ufności. Prędkość odpowiada tu współczynnikowi nachylenia z modelu regresji liniowej dopasowanego do dystansu jako funkcji czasu.

Na dobry początek wczytaliśmy dane distance i time oraz zdefiniowaliśmy funkcję least_squares(), która oblicza wartość prędkości dla każdej próbki.

Instrukcje

100 XP
  • Użyj np.random.choice(), aby wylosować sample_inds z population_inds, zachowując powiązanie dystansu i czasu dla każdej obserwacji.
  • Aby zachować porządek czasowy, wywołaj .sort() na sample_inds, a następnie użyj sample_inds do indeksowania distances i times.
  • Użyj least_squares(times, distances), aby obliczyć parametry modelu liniowego i zapisz a1 w resample_speeds.
  • Zastosuj np.mean() i np.percentiles() do resample_speeds, obliczając prędkość i przedział ufności ci_90, a następnie wyświetl oba wyniki.