Een p-waarde op twee manieren
Je hebt eerder gezien dat er meestal twee manieren zijn om tot de nulverdeling te komen: via berekening en via een wiskundige benadering. De chi-kwadraat goodness-of-fit-toets is daarop geen uitzondering. De benaderingsverdeling is weer de "chi-kwadraatverdeling" met vrijheidsgraden gelijk aan het aantal categorieën min één.
In deze oefening vergelijk je deze twee benaderingen om een p-waarde te berekenen die meet hoe consistent de verdeling van de eerste cijfers in Iran is met de wet van Benford. Let op: de geobserveerde statistiek die je in de vorige oefening maakte, is opgeslagen in je werkruimte als chi_obs_stat.
Deze oefening maakt deel uit van de cursus
Inferentie voor categorische gegevens in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute degrees of freedom
degrees_of_freedom <- ___ %>%
# Pull out first_digit vector
pull("first_digit") %>%
# Calculate n levels and subtract 1
___
# Plot both null dists
___
# Add density layer
___
# Add vertical line at obs stat
___
# Overlay chisq approx
stat_function(fun = dchisq, args = list(df = ___), color = "blue")