Une p-valeur, deux approches
Vous avez déjà vu qu’il existe généralement deux façons d’obtenir la distribution nulle : par le calcul (simulation) et par une approximation mathématique. Le test du khi-deux d’adéquation ne fait pas exception. La distribution d’approximation est encore la « distribution du khi-deux » avec des degrés de liberté égaux au nombre de catégories moins un.
Dans cet exercice, vous allez comparer ces deux approches pour calculer une p-valeur qui mesure la concordance de la distribution des premiers chiffres en Iran avec la loi de Benford. Notez que la statistique observée que vous avez créée dans l’exercice précédent est enregistrée dans votre espace de travail sous le nom chi_obs_stat.
Cet exercice fait partie du cours
Inférence pour des données catégorielles en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
# Pull out first_digit vector
pull("first_digit") %>%
# Calculate n levels and subtract 1
___
# Plot both null dists
___
# Add density layer
___
# Add vertical line at obs stat
___
# Overlay chisq approx
stat_function(fun = dchisq, args = list(df = ___), color = "blue")