1. Learn
  2. /
  3. Courses
  4. /
  5. Podstawy wnioskowania statystycznego w Pythonie

Connected

Exercise

Dopasowywanie rozkładu normalnego

Przy stosunkowo małych zbiorach danych często brakuje wystarczającej ilości obserwacji, by wyciągać rzetelne wnioski. Jeśli jednak podejrzewasz, że dane mają rozkład normalny, warto dopasować taki rozkład i pracować z nim zamiast z surowymi danymi. W tym ćwiczeniu wrócisz do danych dotyczących latynoskich strażaków, które wcześniej wykazały normalność rozkładu na poziomie istotności 5%. Dopasuj do nich rozkład normalny i użyj go do oszacowania, jaki odsetek tych pracowników można spodziewać się z mniej niż 10-letnim stażem pracy.

DataFrame jest już wczytany jako salary_df. Dostępne są również następujące pakiety: pandas jako pd, NumPy jako np, Matplotlib jako plt oraz stats z biblioteki SciPy.

Instructions

100 XP
  • Dopasuj rozkład normalny do kolumny Years of Employment i zapisz uzyskaną średnią oraz odchylenie standardowe.
  • Użyj tej średniej i odchylenia standardowego w dystrybuancie rozkładu normalnego (CDF), aby oszacować odsetek pracowników z mniej niż dziesięcioletnim stażem.
  • Wyświetl ten odsetek.