Goodness-of-fit-toets
De nulhypothese in een goodness-of-fit-toets is een lijst met specifieke parameterwaarden voor elke proportie. In jouw analyse is de gelijkwaardige hypothese dat de wet van Benford van toepassing is op de verdeling van de eerste cijfers van de totale aantallen stemmen op stadsniveau. Je kunt dit zo noteren:
$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$
Waarbij \(p_1\) de hoogte is van de eerste staaf in het staafdiagram van Benford. De alternatieve hypothese is dat minimaal één van deze proporties anders is; dat de verdeling van de eerste cijfers Benfords wet dus niet volgt.
In deze oefening gebruik je simulatie om de nulverdeling op te bouwen van de soorten chi-kwadraatstatistieken die je zou waarnemen als deze aantallen wél Benfords wet zouden volgen.
Deze oefening maakt deel uit van de cursus
Inferentie voor categorische gegevens in R
Oefeninstructies
- Inspecteer
p_benforddoor het op het scherm te printen. - Bereken, beginnend met
iran, de chi-kwadraatstatistiek metchisq_stat. Let op dat je zowel de variabele in het gegevensframe moet opgeven die als response dient als de vector met kansen waarmee je die wilt vergelijken. - Bouw een nulverdeling met 500 steekproeven van de
Chisq-statistiek via simulatie onder depoint-nulhypothese dat de vector met proportiespgelijk is aanp_benford. Sla de resulterende statistieken op alsnull.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Inspect p_benford
p_benford
# Compute observed stat
chi_obs_stat <- ___
chisq_stat(response = ___, p = ___)
# Form null distribution
null <- ___
# Specify the response
___
# Set up the null hypothesis
___
# Generate 500 reps
___
# Calculate statistics
___