Aan de slagGa gratis aan de slag

Genereren en berekenen

De infer-pijplijn voor hypothesetoetsen bestaat uit vier stappen om de nulverdeling te bepalen: specify, hypothesize, generate en calculate.

Laten we doorgaan met de pijplijn die je in de vorige code-oefening bent begonnen. We krijgen een reeks verschillen in proporties die verdeeld zijn alsof de nulhypothese waar is: dat de proportie late leveringen gelijk is tussen de groepen met verschillende vrachtkosten.

late_shipments is beschikbaar; dplyr, infer en ggplot2 zijn geladen.

Deze oefening maakt deel uit van de cursus

Hypothesis Testing in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extend the pipeline to generate 2000 permutations
generated <- late_shipments %>% 
  specify(
    late ~ freight_cost_group, 
    success = "Yes"
  ) %>% 
  hypothesize(null = "independence") %>% 
  ___

# See the result
generated
Code bewerken en uitvoeren