Genereren en berekenen
De infer-pijplijn voor hypothesetoetsen bestaat uit vier stappen om de nulverdeling te bepalen: specify, hypothesize, generate en calculate.
Laten we doorgaan met de pijplijn die je in de vorige code-oefening bent begonnen. We krijgen een reeks verschillen in proporties die verdeeld zijn alsof de nulhypothese waar is: dat de proportie late leveringen gelijk is tussen de groepen met verschillende vrachtkosten.
late_shipments is beschikbaar; dplyr, infer en ggplot2 zijn geladen.
Deze oefening maakt deel uit van de cursus
Hypothesis Testing in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extend the pipeline to generate 2000 permutations
generated <- late_shipments %>%
specify(
late ~ freight_cost_group,
success = "Yes"
) %>%
hypothesize(null = "independence") %>%
___
# See the result
generated