Die größte Gruppe pro County finden
tidyverse-Werkzeuge zum Data Wrangling in Paketen wie dplyr und purrr sind äußerst leistungsfähig, um Census-Daten zu erkunden. tidycensus ist speziell dafür gemacht, Datenexploration im tidyverse zu unterstützen. Nutzerinnen und Nutzer möchten zum Beispiel herausfinden, welche rassische/ethnische Gruppe in jedem County eines bestimmten Bundesstaats am größten ist. Das lässt sich mit den Gruppierungsfunktionen von dplyr erreichen: Damit kannst du die größte ACS-Gruppenschätzung identifizieren und anschließend per Filter nur die Zeilen behalten, die zu dieser Gruppe gehören.
Diese Übung ist Teil des Kurses
US-Census-Daten in R analysieren
Anleitung zur Übung
- Gruppiere den Datensatz
ca_racenach der SpalteGEOID. - Filtere den Datensatz so, dass nur die Zeilen erhalten bleiben, in denen der Wert
estimatedem Maximum innerhalb der jeweiligen Gruppe (dem County) entspricht. - Verwende die Funktion
tally(), um die Verteilung der größten rassischen/ethnischen Gruppen in den Countys von Kalifornien zu ermitteln.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Group the dataset and filter the estimate
ca_largest <- ___ %>%
group_by(___) %>%
filter(___ == max(estimate))
head(ca_largest)
# Group the dataset and get a breakdown of the results
ca_largest %>%
___(___) %>%
___()