Overeenstemming van censusgegevens
Voordat je de wet van Benford toepast, is het belangrijk om te controleren of je gegevensset eraan voldoet. De gegevensset census.2009 bevat de bevolkingsaantallen van 19.509 Amerikaanse steden en dorpen (juli 2009) en werd gebruikt in Nigrini, M. J. (2012). Benford’s Law: Application for Forensic Accounting, Auditing and Fraud Detection. Wiley and Sons: New Jersey. Laten we testen of de bevolkingsaantallen in 2009 voldoen aan de wet van Benford.
De plots tonen de grafieken en de legenda’s apart; klik op Previous Plot om de grafieken te bekijken.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Oefeninstructies
- Laad het pakket
benford.analysis. - Controleer of de variabele
pop.2009overeenkomt met de verdeling volgens de wet van Benford voor het eerste cijfer. Let op: we bekijken alleen de eerste plot die wordt gemaakt. De andere plots vallen buiten de scope van deze cursus. - Vermenigvuldig de variabele
pop.2009met 3 en controleer de overeenstemming opnieuw.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load package benford.analysis
library(___)
data(census.2009)
# Check conformity
bfd.cen <- benford(___$___, number.of.digits = ___)
plot(bfd.cen, except = c("second order", "summation", "mantissa", "chi squared","abs diff", "ex summation", "Legend"), multiple = F)
# Multiply the data by 3 and check conformity again
data <- census.2009$pop.2009 * ___
bfd.cen3 <- benford(___, number.of.digits=___)
plot(bfd.cen3, except = c("second order", "summation", "mantissa", "chi squared","abs diff", "ex summation", "Legend"), multiple = F)