CommencerCommencer gratuitement

Extraire le premier chiffre I

Pour examiner la question d’une fraude électorale, commencez par créer une nouvelle colonne contenant le premier chiffre du nombre total de votes exprimés. Pour cela, vous aurez besoin d’une fonction personnalisée que nous avons créée pour vous, appelée get_first(). Le cœur de cette fonction est substr(), qui prend une chaîne de caractères et en extrait une partie, appelée sous-chaîne.

Une fois que vous avez créé une nouvelle variable ne contenant que le premier chiffre, vous pouvez évaluer à quel point elle suit la loi de Benford en construisant un diagramme en barres.

Cet exercice fait partie du cours

Inférence pour des données catégorielles en R

Afficher le cours

Instructions

  • Regardez comment fonctionne get_first() en tapant simplement le nom de la fonction (sans parenthèses). Elle ne fait que retravailler la sortie de substr() pour qu’elle soit un facteur.
  • Créez une nouvelle colonne dans la trame de données iran appelée first_digit qui contient le premier chiffre du total des votes exprimés, ville par ville.
  • Vérifiez que get_first() a bien fonctionné. À partir des données iran, sélectionnez les colonnes total_votes_cast et first_digit et affichez-les à l’écran.
  • Construisez un diagramme en barres pour visualiser la distribution du premier chiffre.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print get_first
get_first

# Create first_digit variable
iran <- iran %>%
  ___
  
# Check if get_first worked
___ %>%
  ___

# Construct bar plot
___ +
  # Add bar layer
  ___
Modifier et exécuter le code