1. Nauka
  2. /
  3. Kursy
  4. /
  5. Testowanie hipotez w Pythonie

Connected

ćwiczenie

Wizualizacja dopasowania rozkładu

Test zgodności chi-kwadrat porównuje proporcje poszczególnych poziomów zmiennej kategorycznej z wartościami hipotetycznymi. Przed wykonaniem takiego testu warto wizualnie porównać rozkład w próbce z rozkładem hipotetycznym.

Przypomni sobie warunki dostawy (incoterms) dostawców w zbiorze danych late_shipments. Przyjmij hipotezę, że cztery wartości występują w populacji przesyłek z następującymi częstościami:

  • CIP: 0,05
  • DDP: 0,1
  • EXW: 0,75
  • FCA: 0,1

Te częstości są przechowywane w DataFrame hypothesized.

DataFrame incoterm_counts zawiera wynik .value_counts() kolumny vendor_inco_term.

Zbiór danych late_shipments jest dostępny; biblioteki pandas i matplotlib.pyplot są wczytane z ich standardowymi aliasami.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Znajdź całkowitą liczbę wierszy w zbiorze danych late_shipments.