1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Podstawy wnioskowania statystycznego w Pythonie

Connected

Exercise

Rozkład błędów

Niemal żadnego rzeczywistego procesu nie da się przewidzieć idealnie. Pożądanym wynikiem jest sytuacja, w której błąd ma rozkład normalny. Oznacza to, że niektóre rzeczywiste wartości będą wyższe od prognozowanych, a inne – niższe. Innymi słowy, błędy (czyli różnice między wartościami rzeczywistymi a przewidywanymi) będą „unosić się" losowo wokół zera.

W tym ćwiczeniu przeanalizujesz wyniki gotowego modelu liniowego, który przewiduje wynagrodzenie funkcjonariusza policji. Następnie przyjrzysz się błędom i sprawdzisz, czy mają w przybliżeniu rozkład normalny. Predykcje są przechowywane jako lista wartości w preds, a rzeczywiste wynagrodzenia – w salaries.

Instrukcje

100 XP
  • Oblicz błąd jako rzeczywiste wynagrodzenia minus przewidywane wynagrodzenia.
  • Przedstaw błędy na histogramie.
  • Przeprowadź test Andersona-Darlinga na normalność rozkładu błędów.
  • Znajdź i wyświetl poziomy istotności significance_level, przy których hipoteza zerowa zostałaby odrzucona.