Une p-valeur, deux approches

Vous avez déjà vu qu’il existe généralement deux façons d’obtenir la distribution nulle : par le calcul (simulation) et par une approximation mathématique. Le test du khi-deux d’adéquation ne fait pas exception. La distribution d’approximation est encore la « distribution du khi-deux » avec des degrés de liberté égaux au nombre de catégories moins un.

Dans cet exercice, vous allez comparer ces deux approches pour calculer une p-valeur qui mesure la concordance de la distribution des premiers chiffres en Iran avec la loi de Benford. Notez que la statistique observée que vous avez créée dans l’exercice précédent est enregistrée dans votre espace de travail sous le nom chi_obs_stat.

Cet exercice fait partie du cours

Inférence pour des données catégorielles en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
  # Pull out first_digit vector
  pull("first_digit") %>% 
  # Calculate n levels and subtract 1
  ___

# Plot both null dists
___
  # Add density layer
  ___
  # Add vertical line at obs stat
  ___ 
  # Overlay chisq approx
  stat_function(fun = dchisq, args = list(df = ___), color = "blue")

Modifier et exécuter le code