1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Podstawy wnioskowania statystycznego w Pythonie

Connected

Exercise

Testowanie normalności

Wiele zaawansowanych narzędzi statystycznych – w tym szereg popularnych testów hipotez – opiera się na założeniu, że dane mają rozkład normalny. Histogram może sugerować, czy dane są mniej więcej normalnie rozłożone, ale to testy hipotez pozwalają zweryfikować to założenie bezpośrednio. Poza tym histogramy są bardzo wrażliwe na liczbę przedziałów (binów), szczególnie przy małych próbkach.

W tym ćwiczeniu będziesz pracować z danymi o wynagrodzeniach pracowników miasta Austin, zapisanymi w salary_df. Skupisz się na pracownikach straży pożarnej identyfikujących się jako Latynosi. Sprawdzisz, czy staż pracy tych osób ma w przybliżeniu rozkład normalny – za pomocą testu Andersona-Darlinga.

Instrukcje

100 XP
  • Wykreśl histogram przedstawiający kolumnę Years of Employment dla pracowników.
  • Przeprowadź test Andersona-Darlinga, aby sprawdzić, czy Years of Employment ma w przybliżeniu rozkład normalny.
  • Sprawdź, które wartości critical_values są mniejsze od statystyki testowej statistic.
  • Wyświetl poziom(-y) istotności significance_level, przy których hipoteza zerowa zostałaby odrzucona.