1. Nauka
  2. /
  3. Kursy
  4. /
  5. Testowanie hipotez w Pythonie

Connected

ćwiczenie

Testowanie wielkości próby

Aby przeprowadzić test hipotezy i mieć pewność, że wynik jest rzetelny, próba musi spełniać trzy warunki: musi być losową próbą populacji, obserwacje muszą być niezależne, a obserwacji musi być wystarczająco dużo. Spośród tych warunków tylko ostatni można łatwo sprawdzić za pomocą kodu.

Minimalna wielkość próby zależy od rodzaju testu hipotezy, który chcesz przeprowadzić. Przetestujesz teraz kilka scenariuszy na zbiorze danych late_shipments.

Zwróć uwagę, że metoda .all() z biblioteki pandas służy do sprawdzania, czy wszystkie elementy są prawdziwe. Na przykład, dla ramki danych df z wartościami liczbowymi możesz sprawdzić, czy wszystkie jej elementy są mniejsze niż 5, używając (df < 5).all().

Zbiór late_shipments jest dostępny, a pandas jest załadowany jako pd.

Instrukcje 1/4

undefined XP
  • 1
    • Policz wystąpienia każdej wartości w kolumnie freight_cost_group ze zbioru late_shipments.
    • Wstaw odpowiednią liczbę, aby sprawdzić, czy liczby są „wystarczająco duże" do dwupróbkowego testu t.
  • 2
    • Policz wystąpienia każdej wartości w kolumnie late ze zbioru late_shipments.
    • Wstaw odpowiednią liczbę, aby sprawdzić, czy liczby są „wystarczająco duże" do jednopróbkowego testu proporcji.
  • 3
    • Policz wystąpienia każdej wartości w kolumnie freight_cost_group ze zbioru late_shipments, grupując według kolumny vendor_inco_term.
    • Wstaw odpowiednią liczbę, aby sprawdzić, czy liczby są „wystarczająco duże" do testu niezależności chi-kwadrat.
  • 4
    • Policz wystąpienia każdej wartości w kolumnie shipment_mode ze zbioru late_shipments.
    • Wstaw odpowiednią liczbę, aby sprawdzić, czy liczby są „wystarczająco duże" do testu ANOVA.