Goodness of fit visualiseren
De chi-kwadraat goodness-of-fit-toets vergelijkt de proporties van elke categorie van een categorische variabele met veronderstelde waarden. Voordat je zo’n toets uitvoert, is het handig om de verdeling in je steekproef visueel te vergelijken met de veronderstelde verdeling.
Denk terug aan de vendor incoterms in de late_shipments-gegevensset. Laten we veronderstellen dat de vier waarden in de populatie van zendingen met deze frequenties voorkomen.
EXW: 0.75CIP: 0.05DDP: 0.1FCA: 0.1
late_shipments is beschikbaar; tibble, dplyr, ggplot2 en infer zijn geladen.
Deze oefening maakt deel uit van de cursus
Hypothesis Testing in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Using late_shipments, count the vendor incoterms
vendor_inco_term_counts <- ___
# Get the number of rows in the whole sample
n_total <- ___
hypothesized <- tribble(
~ vendor_inco_term, ~ prop,
"EXW", 0.75,
"CIP", 0.05,
"DDP", 0.1,
"FCA", 0.1
) %>%
# Add a column of hypothesized counts for the incoterms
___
# See the results
hypothesized