Extraire le premier chiffre I
Pour examiner la question d’une fraude électorale, commencez par créer une nouvelle colonne contenant le premier chiffre du nombre total de votes exprimés. Pour cela, vous aurez besoin d’une fonction personnalisée que nous avons créée pour vous, appelée get_first(). Le cœur de cette fonction est substr(), qui prend une chaîne de caractères et en extrait une partie, appelée sous-chaîne.
Une fois que vous avez créé une nouvelle variable ne contenant que le premier chiffre, vous pouvez évaluer à quel point elle suit la loi de Benford en construisant un diagramme en barres.
Cet exercice fait partie du cours
Inférence pour des données catégorielles en R
Instructions
- Regardez comment fonctionne
get_first()en tapant simplement le nom de la fonction (sans parenthèses). Elle ne fait que retravailler la sortie desubstr()pour qu’elle soit un facteur. - Créez une nouvelle colonne dans la trame de données
iranappeléefirst_digitqui contient le premier chiffre du total des votes exprimés, ville par ville. - Vérifiez que
get_first()a bien fonctionné. À partir des donnéesiran, sélectionnez les colonnestotal_votes_castetfirst_digitet affichez-les à l’écran. - Construisez un diagramme en barres pour visualiser la distribution du premier chiffre.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print get_first
get_first
# Create first_digit variable
iran <- iran %>%
___
# Check if get_first worked
___ %>%
___
# Construct bar plot
___ +
# Add bar layer
___