1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v Pythonu

Connected

cvičení

Vizualizace dobré shody

Chi-square test dobré shody porovnává proporce jednotlivých úrovní kategorické proměnné s hypotetickými hodnotami. Před samotným testem se hodí vizuálně porovnat rozložení v datech s očekávaným rozložením.

Vzpomeň si na hodnoty incoterms dodavatelů v datasetu late_shipments. Předpokládáme, že čtyři hodnoty se v populaci zásilek vyskytují s těmito frekvencemi:

  • CIP: 0,05
  • DDP: 0,1
  • EXW: 0,75
  • FCA: 0,1

Tyto frekvence jsou uloženy v DataFrame hypothesized.

DataFrame incoterm_counts obsahuje výsledky .value_counts() pro sloupec vendor_inco_term.

Dataset late_shipments je k dispozici; pandas a matplotlib.pyplot jsou načteny pod jejich standardními aliasy.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Zjisti celkový počet řádků v late_shipments.