Een p-waarde op twee manieren

Je hebt eerder gezien dat er meestal twee manieren zijn om tot de nulverdeling te komen: via berekening en via een wiskundige benadering. De chi-kwadraat goodness-of-fit-toets is daarop geen uitzondering. De benaderingsverdeling is weer de "chi-kwadraatverdeling" met vrijheidsgraden gelijk aan het aantal categorieën min één.

In deze oefening vergelijk je deze twee benaderingen om een p-waarde te berekenen die meet hoe consistent de verdeling van de eerste cijfers in Iran is met de wet van Benford. Let op: de geobserveerde statistiek die je in de vorige oefening maakte, is opgeslagen in je werkruimte als chi_obs_stat.

Deze oefening maakt deel uit van de cursus

Inferentie voor categorische gegevens in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
  # Pull out first_digit vector
  pull("first_digit") %>% 
  # Calculate n levels and subtract 1
  ___

# Plot both null dists
___
  # Add density layer
  ___
  # Add vertical line at obs stat
  ___ 
  # Overlay chisq approx
  stat_function(fun = dchisq, args = list(df = ___), color = "blue")

Code bewerken en uitvoeren