LoslegenKostenlos loslegen

Die größte Gruppe pro County finden

tidyverse-Werkzeuge zum Data Wrangling in Paketen wie dplyr und purrr sind äußerst leistungsfähig, um Census-Daten zu erkunden. tidycensus ist speziell dafür gemacht, Datenexploration im tidyverse zu unterstützen. Nutzerinnen und Nutzer möchten zum Beispiel herausfinden, welche rassische/ethnische Gruppe in jedem County eines bestimmten Bundesstaats am größten ist. Das lässt sich mit den Gruppierungsfunktionen von dplyr erreichen: Damit kannst du die größte ACS-Gruppenschätzung identifizieren und anschließend per Filter nur die Zeilen behalten, die zu dieser Gruppe gehören.

Diese Übung ist Teil des Kurses

US-Census-Daten in R analysieren

Kurs anzeigen

Anleitung zur Übung

  • Gruppiere den Datensatz ca_race nach der Spalte GEOID.
  • Filtere den Datensatz so, dass nur die Zeilen erhalten bleiben, in denen der Wert estimate dem Maximum innerhalb der jeweiligen Gruppe (dem County) entspricht.
  • Verwende die Funktion tally(), um die Verteilung der größten rassischen/ethnischen Gruppen in den Countys von Kalifornien zu ermitteln.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Group the dataset and filter the estimate
ca_largest <- ___ %>%
  group_by(___) %>%
  filter(___ == max(estimate)) 

head(ca_largest)

# Group the dataset and get a breakdown of the results
ca_largest %>% 
  ___(___) %>%
  ___()
Code bearbeiten und ausführen