LoslegenKostenlos starten

Die erste Ziffer extrahieren I

Um die Frage nach Wahlbetrug anzugehen, erstelle zunächst eine neue Datenspalte, die die erste Ziffer der Gesamtzahl der abgegebenen Stimmen enthält. Dafür brauchst du eine benutzerdefinierte Funktion, die wir für dich erstellt haben: get_first(). Der Kern dieser Funktion ist substr(), das einen String nimmt und einen Abschnitt daraus – ein sogenanntes Substring – extrahiert.

Sobald du eine neue Variable erstellt hast, die nur die erste Ziffer enthält, kannst du mithilfe eines Balkendiagramms prüfen, wie gut die Verteilung dem Benfordschen Gesetz folgt.

Diese Übung ist Teil des Kurses

<Kurs>Schlussfolgern für kategoriale Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Schau dir an, wie get_first() funktioniert, indem du einfach den Namen der Funktion eintippst (ohne Klammern). Sie passt lediglich die Ausgabe von substr() so an, dass sie ein Faktor ist.
  • Füge per mutate eine neue Spalte im Data Frame iran namens first_digit hinzu, die die erste Ziffer der stadtweise abgegebenen Gesamtstimmen enthält.
  • Prüfe, ob get_first() funktioniert hat. Wähle aus den iran-Daten die Spalten total_votes_cast und first_digit aus und gib sie auf dem Bildschirm aus.
  • Erstelle ein Balkendiagramm, um die Verteilung der ersten Ziffer zu visualisieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Print get_first
get_first

# Create first_digit variable
iran <- iran %>%
  ___
  
# Check if get_first worked
___ %>%
  ___

# Construct bar plot
___ +
  # Add bar layer
  ___
Code bearbeiten und ausführen