Générer et calculer
Le flux de travail infer pour les tests d’hypothèse comporte quatre étapes pour calculer la distribution nulle : specify, hypothesize, generate et calculate.
Poursuivons le pipeline commencé dans l’exercice de code précédent. Nous allons obtenir un ensemble de différences de proportions réparties comme si l’hypothèse nulle — à savoir que la proportion d’expéditions en retard est la même selon les groupes de coût de fret — était vraie.
late_shipments est disponible ; dplyr, infer et ggplot2 sont chargés.
Cet exercice fait partie du cours
Tests d’hypothèses en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extend the pipeline to generate 2000 permutations
generated <- late_shipments %>%
specify(
late ~ freight_cost_group,
success = "Yes"
) %>%
hypothesize(null = "independence") %>%
___
# See the result
generated