Aan de slagGa gratis aan de slag

Goodness-of-fit visualiseren

De chi-kwadraat goodness-of-fit-toets vergelijkt de proporties van elke categorie van een categorische variabele met gehypothetiseerde waarden. Voordat je zo’n toets uitvoert, is het handig om de verdeling in je steekproef visueel te vergelijken met de gehypothetiseerde verdeling.

Denk terug aan de vendor-incoterms in de gegevensset late_shipments. Je veronderstelt dat de vier waarden in de populatie van zendingen met deze frequenties voorkomen.

  • CIP: 0.05
  • DDP: 0.1
  • EXW: 0.75
  • FCA: 0.1

Deze frequenties zijn opgeslagen in de DataFrame hypothesized.

De DataFrame incoterm_counts bevat de .value_counts() van de kolom vendor_inco_term.

late_shipments is beschikbaar; pandas en matplotlib.pyplot zijn geladen met hun standaardaliassen.

Deze oefening maakt deel uit van de cursus

Hypothesetoetsen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Find the number of rows in late_shipments
n_total = ____

# Print n_total
print(n_total)
Code bewerken en uitvoeren