Conformité des données du recensement
Avant d’utiliser la loi de Benford, il est important de vérifier si votre jeu de données y est conforme. Le jeu de données census.2009 contient les populations de 19 509 villes et communes des États-Unis (juillet 2009) et a été utilisé dans Nigrini, M. J. (2012). Benford’s Law: Application for Forensic Accounting, Auditing and Fraud Detection. Wiley and Sons : New Jersey. Testons si les populations en 2009 respectent la loi de Benford.
Les tracés afficheront séparément les graphiques et les légendes ; cliquez sur Previous Plot pour parcourir les graphiques.
Cet exercice fait partie du cours
Détection de fraude en R
Instructions
- Chargez le package
benford.analysis. - Vérifiez la conformité de la variable
pop.2009à la distribution de la loi de Benford pour le premier chiffre. Notez que nous ne regardons que le premier graphique produit. Les autres graphiques ne sont pas au programme de ce cours. - Multipliez la variable
pop.2009par 3 et vérifiez à nouveau la conformité.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load package benford.analysis
library(___)
data(census.2009)
# Check conformity
bfd.cen <- benford(___$___, number.of.digits = ___)
plot(bfd.cen, except = c("second order", "summation", "mantissa", "chi squared","abs diff", "ex summation", "Legend"), multiple = F)
# Multiply the data by 3 and check conformity again
data <- census.2009$pop.2009 * ___
bfd.cen3 <- benford(___, number.of.digits=___)
plot(bfd.cen3, except = c("second order", "summation", "mantissa", "chi squared","abs diff", "ex summation", "Legend"), multiple = F)