1. Nauka
  2. /
  3. Kursy
  4. /
  5. Testowanie hipotez w Pythonie

Connected

ćwiczenie

Wilcoxon-Mann-Whitney

Kolejną klasą nieparametrycznych testów hipotez są testy sumy rang. Rangi to pozycje wartości liczbowych uszeregowanych od najmniejszej do największej. Wyobraź sobie je jak miejsca na podium w biegu: kto ma najlepszy (najkrótszy) czas, zajmuje rangę 1, drugi w kolejności – rangę 2 i tak dalej.

Dzięki obliczeniom na rangach danych zamiast na ich rzeczywistych wartościach można uniknąć założeń dotyczących rozkładu statystyki testowej. Metoda ta jest bardziej odporna na odchylenia – podobnie jak mediana jest bardziej odporna niż średnia.

Jednym z popularnych testów opartych na rangach jest test Wilcoxona-Manna-Whitneya, który pełni rolę nieparametrycznego odpowiednika testu t.

Dostępny jest zbiór danych late_shipments, a następujące pakiety zostały już załadowane: pingouin oraz pandas jako pd.

Instrukcje

100 XP
  • Wybierz kolumny weight_kilograms i late ze zbioru late_shipments i przypisz wynik do zmiennej weight_vs_late.
  • Przekształć weight_vs_late z formatu długiego na szeroki, ustawiając columns na 'late'.
  • Przeprowadź test Wilcoxona-Manna-Whitneya, aby sprawdzić, czy masa przesyłki różni się w zależności od tego, czy dostawa była opóźniona, czy terminowa.