LoslegenKostenlos loslegen

Die erste Ziffer extrahieren I

Um die Frage nach Wahlbetrug anzugehen, erstelle zunächst eine neue Datenspalte, die die erste Ziffer der Gesamtzahl der abgegebenen Stimmen enthält. Dafür brauchst du eine benutzerdefinierte Funktion, die wir für dich erstellt haben: get_first(). Der Kern dieser Funktion ist substr(), das einen String nimmt und einen Abschnitt daraus – ein sogenanntes Substring – extrahiert.

Sobald du eine neue Variable erstellt hast, die nur die erste Ziffer enthält, kannst du mithilfe eines Balkendiagramms prüfen, wie gut die Verteilung dem Benfordschen Gesetz folgt.

Diese Übung ist Teil des Kurses

Schlussfolgern für kategoriale Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Schau dir an, wie get_first() funktioniert, indem du einfach den Namen der Funktion eintippst (ohne Klammern). Sie passt lediglich die Ausgabe von substr() so an, dass sie ein Faktor ist.
  • Füge per mutate eine neue Spalte im Data Frame iran namens first_digit hinzu, die die erste Ziffer der stadtweise abgegebenen Gesamtstimmen enthält.
  • Prüfe, ob get_first() funktioniert hat. Wähle aus den iran-Daten die Spalten total_votes_cast und first_digit aus und gib sie auf dem Bildschirm aus.
  • Erstelle ein Balkendiagramm, um die Verteilung der ersten Ziffer zu visualisieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print get_first
get_first

# Create first_digit variable
iran <- iran %>%
  ___
  
# Check if get_first worked
___ %>%
  ___

# Construct bar plot
___ +
  # Add bar layer
  ___
Code bearbeiten und ausführen