Die erste Ziffer extrahieren I
Um die Frage nach Wahlbetrug anzugehen, erstelle zunächst eine neue Datenspalte, die die erste Ziffer der Gesamtzahl der abgegebenen Stimmen enthält. Dafür brauchst du eine benutzerdefinierte Funktion, die wir für dich erstellt haben: get_first(). Der Kern dieser Funktion ist substr(), das einen String nimmt und einen Abschnitt daraus – ein sogenanntes Substring – extrahiert.
Sobald du eine neue Variable erstellt hast, die nur die erste Ziffer enthält, kannst du mithilfe eines Balkendiagramms prüfen, wie gut die Verteilung dem Benfordschen Gesetz folgt.
Diese Übung ist Teil des Kurses
Schlussfolgern für kategoriale Daten in R
Anleitung zur Übung
- Schau dir an, wie
get_first()funktioniert, indem du einfach den Namen der Funktion eintippst (ohne Klammern). Sie passt lediglich die Ausgabe vonsubstr()so an, dass sie ein Faktor ist. - Füge per
mutateeine neue Spalte im Data Frameirannamensfirst_digithinzu, die die erste Ziffer der stadtweise abgegebenen Gesamtstimmen enthält. - Prüfe, ob
get_first()funktioniert hat. Wähle aus deniran-Daten die Spaltentotal_votes_castundfirst_digitaus und gib sie auf dem Bildschirm aus. - Erstelle ein Balkendiagramm, um die Verteilung der ersten Ziffer zu visualisieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print get_first
get_first
# Create first_digit variable
iran <- iran %>%
___
# Check if get_first worked
___ %>%
___
# Construct bar plot
___ +
# Add bar layer
___