Szacowanie prędkości i przedziału ufności

Kontynuujmy analizę danych turystycznych z parków narodowych. Zwróć uwagę, że niektóre wartości dystansu są ujemne – oznacza to ruch w kierunku przeciwnym do punktu startowego szlaku. Dane są niedoskonałe, więc skupmy się na ogólnym trendzie.

Celem tego ćwiczenia jest zastosowanie metody bootstrap do wyznaczenia rozkładu wartości prędkości dla modelu liniowego, a następnie obliczenie na jego podstawie najlepszego oszacowania prędkości oraz 90-procentowego przedziału ufności. Prędkość odpowiada tu współczynnikowi nachylenia z modelu regresji liniowej dopasowanego do dystansu jako funkcji czasu.

Na dobry początek wczytaliśmy dane distance i time oraz zdefiniowaliśmy funkcję least_squares(), która oblicza wartość prędkości dla każdej próbki.

Użyj np.random.choice(), aby wylosować sample_inds z population_inds, zachowując powiązanie dystansu i czasu dla każdej obserwacji.
Aby zachować porządek czasowy, wywołaj .sort() na sample_inds, a następnie użyj sample_inds do indeksowania distances i times.
Użyj least_squares(times, distances), aby obliczyć parametry modelu liniowego i zapisz a1 w resample_speeds.
Zastosuj np.mean() i np.percentiles() do resample_speeds, obliczając prędkość i przedział ufności ci_90, a następnie wyświetl oba wyniki.

ćwiczenie

Szacowanie prędkości i przedziału ufności

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie