Aan de slagGa gratis aan de slag

Goodness-of-fit-toets

De nulhypothese in een goodness-of-fit-toets is een lijst met specifieke parameterwaarden voor elke proportie. In jouw analyse is de gelijkwaardige hypothese dat de wet van Benford van toepassing is op de verdeling van de eerste cijfers van de totale aantallen stemmen op stadsniveau. Je kunt dit zo noteren:

$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$

Waarbij \(p_1\) de hoogte is van de eerste staaf in het staafdiagram van Benford. De alternatieve hypothese is dat minimaal één van deze proporties anders is; dat de verdeling van de eerste cijfers Benfords wet dus niet volgt.

In deze oefening gebruik je simulatie om de nulverdeling op te bouwen van de soorten chi-kwadraatstatistieken die je zou waarnemen als deze aantallen wél Benfords wet zouden volgen.

Deze oefening maakt deel uit van de cursus

Inferentie voor categorische gegevens in R

Cursus bekijken

Oefeninstructies

  • Inspecteer p_benford door het op het scherm te printen.
  • Bereken, beginnend met iran, de chi-kwadraatstatistiek met chisq_stat. Let op dat je zowel de variabele in het gegevensframe moet opgeven die als response dient als de vector met kansen waarmee je die wilt vergelijken.
  • Bouw een nulverdeling met 500 steekproeven van de Chisq-statistiek via simulatie onder de point-nulhypothese dat de vector met proporties p gelijk is aan p_benford. Sla de resulterende statistieken op als null.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect p_benford
p_benford

# Compute observed stat
chi_obs_stat <- ___
  chisq_stat(response = ___, p = ___)

# Form null distribution
null <- ___
  # Specify the response
  ___
  # Set up the null hypothesis
  ___
  # Generate 500 reps
  ___
  # Calculate statistics
  ___
Code bewerken en uitvoeren